学科分类
/ 25
500 个结果
  • 简介:由于工具书编纂队伍庞大,工作流程上又多头并进,所以工具书编纂过程中难免会出现内容交叉重复问题。为了减少工具书查重的工作量,文章提出了一种基于文本的查重方法。试验表明,分层算法可用于大型工具书词条查重工作,它对工具书编纂中解决词条交叉重复问题是有效的。

  • 标签: 文本聚类 特征词 交叉重复 工具书查重
  • 简介:摘要:德语是德国的官方语言,也是欧盟境内使用人数最多的母语,全世界约有2亿人使用德语进行交流,庞大的德语使用人群贡献了不计其数的德语数字化文本信息。与汉语、英语等语言相比,目前国内外对德语文本挖掘的研究较少,还远未成熟,准确性不令人满意。其中,德语文本研究仍处于起步阶段,目前尚未见国内外有系统的德语文本方法研究,而当前较为成熟的汉语和英语文本方法无法直接应用于德语文本

  • 标签: 特征词配对 德语 文本聚类方法
  • 简介:随着网络通信技术和无线传感硬件设备的不断发展,数据流已成为一种新的数据处理模式。文中比较了数据流方法与传统的聚类分析方法的不同、介绍了数据流模型特点、数据流算法特点、生成概要数据结构的常用方法,同时详细阐述了在扩展传统算法的基础上研究数据流方法的发展,从而为以后进一步的流聚类分析研究奠定了基础。

  • 标签: 数据流 数据流处理模型 数据流聚类算法
  • 简介:分析了异常入侵检测存在的问题,研究了基于模糊的入侵检测算法.该算法采用C-均值算法,通过训练数据、异常划分和行为判定等3个步骤实现异常入侵检测.试验采用KDD99数据进行了测试,证明该算法是可行和有效的.

  • 标签: 入侵检测 模糊聚类 数据挖掘 C-均值算法
  • 简介:对于一变量非线性相关的面板数据,现有的基于线性算法的面板数据方法并不能准确地度量样本间的相似性,且结果的可解释性低。综合考虑变量非线性相关问题及结果可解释性问题,提出一种非线性面板数据的方法,通过非线性核主成分算法实现对样本相似性的测度,并基于混合高斯模型进行样本概率,实证表明该方法的有效性及其对结果的可解释性有所提高。

  • 标签: 非线性 面板数据聚类 核主成分算法 混合高斯模型
  • 简介:一、作品展示台:海光上过夜的人们,常有机会欣赏绚丽的海光。海光,是海洋生物发出光亮的自然现象。有趣的是,各种各样的海洋生物,从细菌到鱼类,从小虾到乌贼,都有这种发光的代表。细菌小得只能在显微镜下才能看清它们的面貌,可是它却出人意外地利用呼

  • 标签: 作品阅读 文本解读 解读说明
  • 简介:清醒答题,高考复习的终结追求。高三复习就要指导学生学会审题,明晰设题意图,通过反复训练,让学生熟练掌握各类题型的答题方向和答案要点,以期在高考中能举重若轻,做到答题规范,要点全面。现就文学文本阅读解题方法的指导作初浅的陈述,见教于大方。

  • 标签: 解题方法 文本阅读 文学类 高考复习 高三复习 反复训练
  • 简介:针对网络学习者及其对案例访问的模糊性提出采用模糊方法对学习者和案例进行聚类分析。在算法中,以各学习者对案例的访问次数、时间、学习效率等刻画学习者对案例的关注程度建立模糊相似矩阵,再由平方法求出模糊等价矩阵,然后进行聚类分析。通过具体实例阐述算法的计算过程,证明算法实现的可行性和有效性。

  • 标签: WEB日志挖掘 模糊聚类 模糊集 模糊等价矩阵
  • 简介:搜索在计算机上是多种操作的基本运算,其主要目的是从大量数据当中找出所想要的部分,而一般数据的存放,常设有键值(Key)以利搜索,例如在数据库中,要取得数据一定要配合许多键值的使用,方能有效而快速地存取。

  • 标签: 搜索方法 聚类技术 计算机 数据库 键值 存取
  • 简介:以白桦240个家系的胸径、树高、材积和纤维素含量数据为依据,采用马氏距离计算家系间距离、10%的取样比例和优先取样法,研究了最短距离法、最长距离法、中间距离法、重心法、平均法、加权配对算术平均法、可变法和离差平方和法建构的核心种质与原种质的遗传参数、性状相关性及分布格局。结果表明,最短距离法构建白桦初级核心种质均值差异百分率、极差符合率、方差差异百分率和极差符合率分别为0、100%、75%和143%,4个性状相关性显著、相关系数均超过0.5,保持了原种质资源的空间分布格局,是构建白桦核心种质最佳方法

  • 标签: 白桦 原种质 核心种质 聚类方法
  • 简介:随着低资费套餐的快速普及,LTE高负荷问题日渐突出,高负荷小区整治成为网络运维的重要任务。本文提出LTE高负荷小区优化方法,将问题小区至5大13小,并对各类问题提出针对性的优化处理建议,形成系统的高负荷小区整治方法

  • 标签: LTE 高负荷 聚类 优化
  • 简介:[目的/意义]作为城市化进程中的“顽疾”,群租房屡禁不止,群租房引发的社会问题层出不穷。这一系列问题引发了微博热议,群租房微博舆情文本分析有助于获悉群租房存在的问题,从受众角度探讨政府群租房治理成效。[方法/过程]利用网络大数据爬取与分析技术,以群租房为研究对象,通过文本聚类分析与情感分析,进行热点评估,补充现有文献中忽视的群租房治理舆论研究。[结果/结论]研究发现,微博网民对群租房话题的关注明显呈波动趋势,讨论话题主要包括群租房产生的社会问题、政府对群租房的整治行动评价以及透过群租房现象折射出的中低收入群体的焦虑感。大多数微博网民在舆论场中的情感趋势为负面,认为有必要对群租房展开治理。本文的创新之处在于分析政府治理群租房所面对的舆论环境,并将其可视化呈现,为政府深入了解民情,制定适应民意的政策作铺垫。

  • 标签: 群租房 社会舆情 文本聚类 情感分析
  • 简介:摘要:本文旨在通过k-means文本了解国内大数据岗位需求特点,帮助企业和员工识别大数据人才,推动大数据相关研究的进一步发展。首先利用爬虫软件对招聘网“大数据”的招聘信息进行爬取招聘网站。然后利用解霸分词和K-means文本对大数据招聘岗位进行数由组内平均平方和确定。最后,将大数据岗位划分为10,从整体数据集和结果的角度对大数据岗位的城市分布、薪资水平、学历要求、经验要求等进行讨论和分析,明确大数据岗位的特点。大数据工作需求。分析结果表明,大数据的工作需求主要分布在一线城市和新一线城市。企业更倾向于大专或本科学历及一年以上相关工作经验的求职者。不同类型的工作之间存在工资差异。职位越高,对学历和经验的要求就越高。

  • 标签: 大数据 K-means技术 岗位需求分析
  • 简介:摘要论述文本是指具有说服色彩的说理性文本,在类型上包括说明文、议论文、评论等,主要的文本特征为说理性、逻辑性,是语文高考的必出题型之一。掌握论述文本阅读的方法是提高高考分数的关键。本文基于高考语文中的论述文本阅读进行了阐述,并以2018年高考题为例,阐述了论述文章的文本阅读方法,希望可以为相关人士提供经验借鉴。

  • 标签: 高考语文 论述类文本 文本阅读 阅读方法
  • 简介:摘要随着跨文化交流的不断加强,外语的应用越来越普遍,社会对应用型外语人才的要求也越来越高。本文将从理论联系实际的角度,具体阐述旅游文本的特点及中日文互译时的翻译方法,希望能够对相关专业的学习者有所助益,提升日语实践应用能力。

  • 标签: 旅游类文本 功能 特点 翻译方法
  • 简介:针对相机运动引起的图像序列运动的问题,提出了一种基于的相位相关块匹配运动估计算法。利用Harris算子分别在相邻帧图像上检测角点,以参考图像角点为中心选取一个矩形块,将块匹配法与相位相关相结合来计算图像间的运动矢量。最后,对获得的多个块的平移量,进行空间从而选取运动估计比较准确的点。实验结果表明:该算法配准精度能达到亚像素,稳定性较好。

  • 标签: 图像配准 特征点 相位相关 聚类
  • 简介:轮廓线的变点识别是质量管理的研究热点之一,当前研究多以轮廓整体变化为识别对象,而对局部变化问题研究相对较少,且更少有在发现变异时间的同时能够寻找到变化区域在个体轮廓曲线上位置的系统方法。本文针对轮廓线局部变化识别问题,提出基于小波变换和聚类分析的方法。通过仿真性能评价,并与现有方法进行比较,结果显示本方法能够在更小的差异度检测出变化并准确定位变化区域。在文章的末尾,本文采用了一个实例对该方法的效果进行验证。

  • 标签: 变点识别 聚类分析 小波变换 轮廓线 统计过程控制
  • 简介:针对参数相近、互相交叠的非常规雷达信号分选所面临的困难,提出一种改进的方法,并将其应用于常规分选方法提取后的剩余雷达信号.通过大量的仿真实验,验证了此分选方法的可行性.

  • 标签: 聚类 雷达 信号分选 K-MEANS 质心
  • 简介:为了在保证计算精度的前提下使模型简化并便于计算,要尽量少地用对模型影响较大、相互独立的特征变量进行建模。在进行特征变量选择时,既要考虑选择对主因素有重要影响的变量,也要排除各影响变量间的多重相关性的干扰。首先建立各特征变量同费用的灰色关联度,根据关联度的大小对众多特征变量进行排序,排除关联度相对极小并同其他因素关联度差异明显的特征变量,减少次要影响因素对估算结果造成的干扰;其次,应用基于特征权值的模糊动态方法,并突出近期数据的重要性,对影响因素进行聚类分析,排除影响因素间多重相关性的干扰。论文通过实例分析进行了验证。

  • 标签: 灰色关联分析 模糊聚类 变量选择 特征加权
  • 简介:本文提出一种基于的电网运行监控信息辨识分类方法,其特征在于,以大量的电网运行监控信息为基础,按照监控信息发出时间为依据进行分段,将原本连续的监控信息切分成多个文本,而后采用统计学的方法文本进行预处理形成对应特征向量,并通过数据挖掘的方法对特征向量集合进行聚类分析得出规则。最终实现对监控信息的自动辨识分类功能,辅助电网监控人员及时发现设备发出的告警信号,维护电网安全稳定运行的目的。

  • 标签: