学科分类
/ 25
500 个结果
  • 简介:【摘要】:形态分析是一种重要的技术分析方法, 如何在不同板块众多种类的股票中挑选出具有投资价值的股票已经成为一个亟待解决的问题。道氏理论认为市场波动具有某种趋势,不同时期多空双方力量对比的大小决定了股票价格时间序列是向上还是向下运行。找到对盈利有益的形态,是投资者关心的目标。本章方法提供的程序经过适当的修改,便可以对以上提出的问题进行进一步的检验。

  • 标签: 股票市场 聚类分析 主成分分析
  • 简介:针对半监督算法易受噪点的影响,提出一种基于数据清洗的改进半监督算法DCSC。将噪点从数据集中提取出来另行分析。从数据清洗处理后的数据集中抽取若干正常与异常样本分别计算作为初始样本辅助K-Means算法进行。实验结果表明,与现有相关算法相比,该算法具有检测未知攻击的能力,且具有更高的攻击检测率以及更低的误报率。

  • 标签: 数据清洗 半监督聚类 入侵检测
  • 简介:摘要:由于模糊C均值算法容易受到参数和噪声的影响,同时没有考虑点云数据空间信息,导致分割结果不够准确等问题。本文利用点云法向量,提出了基于法向量加权的模糊C均值算法并且证明其算法的收敛性。通过对建筑物点云和手背点云进行分割,实验结果表明:改进算法的实验结果比模糊C均值算法更精确,更具有实际意义。

  • 标签: 点云数据 聚类分析 数据划分 平面拟合 收敛性
  • 简介:摘要双(Biclustering)算法在数据挖掘中是一个新兴的算法,对于矩阵类型的数据,其效果很好。本文浅述了双算法的基本特点,并提出了用迭代的双算法对未知的数据进行分类,并对一组数据进行了测试,其分类表现不错。

  • 标签: 双聚类 数据挖掘 迭代 分类
  • 简介:摘要:本文旨在通过k-means文本了解国内大数据岗位需求特点,帮助企业和员工识别大数据人才,推动大数据相关研究的进一步发展。首先利用爬虫软件对招聘网“大数据”的招聘信息进行爬取招聘网站。然后利用解霸分词和K-means文本对大数据招聘岗位进行数由组内平均平方和确定。最后,将大数据岗位划分为10,从整体数据集和结果的角度对大数据岗位的城市分布、薪资水平、学历要求、经验要求等进行讨论和分析,明确大数据岗位的特点。大数据工作需求。分析结果表明,大数据的工作需求主要分布在一线城市和新一线城市。企业更倾向于大专或本科学历及一年以上相关工作经验的求职者。不同类型的工作之间存在工资差异。职位越高,对学历和经验的要求就越高。

  • 标签: 大数据 K-means技术 岗位需求分析
  • 简介:聚类分析在数据挖掘领域中占有重要地位,到目前为止学者们提出了许多的算法.本文提出了一种基于kNN的算法k-NearestNeighborCluster(kNNC).该算法首先找到每个数据点的k个邻居点,然后设置匹配点数n,通过使用每个点的邻居点进行匹配进而达到效果.本文通过三个实验去验证该算法,并且与k-means算法进行比较.实验结果表明,该算法具有稳定的正确率,而其最大的优点是不需要预先设定聚簇数,它可以大致的找到的簇数.

  • 标签: KNN算法 K-MEANS算法 聚类分析 微博文本聚类
  • 简介:为提取比特中各未知协议对应的比特子集,提出了一种基于和模式串匹配的未知协议比特分类方法。在获取比特压缩率、汉明重量和游程频数等统计特征的基础上,先采用K-medoids算法对比特数据进行初步,再通过随机抽样和基于有向图的模式串匹配,将已知协议比特从各中筛除。对实验数据集的测试结果验证了所提方法的有效性。

  • 标签: 比特流 协议识别 聚类 K-me
  • 简介:论文在分析推荐输入瓶颈问题的基础上,借助社区思想实现了显式评分输入的用户,解决了评分矩阵稀疏的问题;借助用户兴趣度的定义,实现了隐式浏览输入的用户,解决了用户兴趣度不易获取的问题.论文的研究立足于推荐系统的输入,通过聚类分析,为推荐算法的研究奠定了理论基础.

  • 标签: 推荐系统 显式评分输入 隐式浏览输入 用户兴趣度 稀疏矩阵 聚类分析
  • 简介:数据挖掘中重要组成部分,为了提高的处理效率,将并行处理技术运用于k-means和PAM算法中,对k-means与PAM算法进行了改进。实验结果表明:并行k-means算法相对串行k-means算法有更好的执行效率;且k-means算法有比PAM算法更好的并行性和可扩展性。最后,该文提出和介绍了将并行技术引入谱算法。

  • 标签: 聚类算法 并行 K-MEANS PAM
  • 简介:烃化防老剂是新开发的耐抽提、抗老化性能好,且永不变色,是目前浅色橡胶制品首选的防老剂品种,另外也是天然和聚氯丁二烯橡胶最佳防老剂。烃化酚化学名称为:对甲酚和双环戊二烯丁基化反应产物,烃化酚合成主要分为两步,先由对甲酚和双环戊二烯进行缩聚,然后在异丁烯存在下进行烃基化。

  • 标签: 防老剂 酚类 烃化 双环戊二烯 抗老化性能 丁二烯橡胶
  • 简介:文本技术作为处理和组织大量文本数据的一项重要技术,能够在很大程度上解决由于信息爆炸所带来的问题。Sollin算法是构建最小生成树的典型算法,与Kruskal算法和Prim算法相比,具有容易实现并行运算的特点。因此,利用基于Sollin的快速层次算法在复旦语料和搜狗语料上进行实验,结果表明基于Sollin的快速层次算法在运行效率和质量上都优于传统层次算法。

  • 标签: 层次聚类 Sollin算法 运行效率 聚类质量
  • 简介:分析了异常入侵检测存在的问题,研究了基于模糊的入侵检测算法.该算法采用C-均值算法,通过训练数据、异常划分和行为判定等3个步骤实现异常入侵检测.试验采用KDD99数据进行了测试,证明该算法是可行和有效的.

  • 标签: 入侵检测 模糊聚类 数据挖掘 C-均值算法
  • 简介:聚类分析是数理统计中研究“物以类聚”的一种方法。近十几年,随着数理统计的多元分析方法的迅速发展,多元分析的技术便被引进到分类学中来,并形成聚类分析这个新的分支。聚类分析目前已广泛应用于自然科学研究领域,比如考古、地质、化学、生物等等。实际上,对经济管理、社会统计等部门的社会经济问题,也都可以应用聚类分析的方法来进行研究。

  • 标签: 经济区域 聚类划分 应用 聚类分析 社会经济问题 数理统计