学科分类
/ 25
500 个结果
  • 简介:摘要关联规则反映了大量数据中项集之间的相互依存性和关联性。Apriori算法关联规则挖掘中的经典算法。本文在对Apriori算法分析的基础上,针对该算法存在的缺陷,即会产生大量冗余的候选集并频繁扫描数据库,提出了改进的Apriori算法,并给予验证。实践证明,改进后的算法效率优于传统的算法

  • 标签: 数据挖掘 频繁项集 Apriori算法 关联规则
  • 简介:对Apriori算法进行优化,提出了一种Z_Apriori算法。该算法在首次产生频繁项集时。扫描数据库并通过二进制编码串记录每个项目在事务里是否出现过,在每次进行计算迭代过程中无需再对数据库进行扫描.避免了对数据库的重复扫描,在系统性能和效率上较经典的Apriori算法有一定的改善。

  • 标签: 关联规则 个性化推荐服务 频繁项集
  • 简介:然后扫描数据库来确定Ck中那些k-项目集是频繁项目集,频繁k项集c的每一单个项目i所对应的频繁1项集{i}或者从L1中取,所以在利用FUP算法关联规则进行更新时

  • 标签: 关联规则 增量更新 更新算法
  • 简介:针对数据删除的关联规则的更新问题,提出了一种新的算法,该算法充分利用了保留下来的原数据库中所有项目的计数以及挖掘出来的最大频繁项目集及其计数,找出更新后的数据库中新增的频繁一项集和被删除的原频繁一项集,进而挖掘出更新后的关联规则

  • 标签: ARNUDI 关联规则 增量更新 最大频繁项目集
  • 简介:设计了一种基于遗传算法关联规则算法,该算法将遗传算法关联规则相结合.对遗传算法的编码方法、适应度函数的构造、交叉算子和变异算子进行了分析,给出了所设计方法的具体步骤,并进行了试验.试验表明,改进后的算法的执行效率高于Apriori算法.

  • 标签: 数据挖掘 关联规则 遗传算法
  • 简介:摘要当今信息化发展速度惊人,大数据、云计算、人工智能技术应用于各行各业,给社会的发展带来了很多便利,也为我国经济的快速发展注入了新的血液。因此,根据实际情况研发出科学而有效的数据挖掘算法,对于整个信息行业来说都有不可估量的意义,在进行大规模数据信息处理的时候,在关联规则下的数据挖掘算法就体现出了它本身重要的优势。因此,本文将对关联规则下的数据挖掘算法进行详细的分析,以供参考。

  • 标签: 数据挖掘算法 关联规则 分析
  • 简介:发现频繁项集是数据挖掘应用中的关键问题,发现过程的高花费要求对增量数据挖掘算法进行深入研究.考虑保持最小支持度不变,一个事务数据集d动态的添加到事务数据库D中时,利用基于矩阵的MFUP(Matrix_Fast_Update)算法生成事务数据库DUd中的频繁项集.

  • 标签: 数据挖掘 频繁项目集 关联规则 增量式更新
  • 简介:传统的关联规则Apriori算法在产生频繁项集的过程中,需要多次扫描事务数据库以及多次扫描频繁项集,从而造成算法性能下降.为了减少扫描事务数据库以及频繁项集的次数,在生成的候选k项集中,除了存储项集item-set以及支持度计数count之外,加入事务标识符列表Tidlist属性,在生成频繁k项集时,可以直接通过Tid-list的交集得出事务标识符列表以及项集的计数,不需要去扫描事务数据库,从而可以有效地提高算法的性能.文中提出了一种改进的关联规则挖掘模型以及关联规则挖掘算法I-Apriori算法.实验证明,I-Apriori算法相比Apriori算法的执行时间有明显改进.

  • 标签: 关联规则 频繁项集 候选集 事务数据库 计数
  • 简介:关联规则挖掘中,通常使用支持度和置信度来衡量一条规则是否为强关联规则,但从理论和实践中分析,发现传统方法挖掘生成的规则中存在大量冗余,甚至错误。本文通过引入统计学中的相关系数ρ作为新的阈值---兴趣度,对事务数据的关联属性进行度量,实验结果表明,改进后的算法在相同条件下可以得到质量更好、意义更明确的关联规则

  • 标签: 兴趣度 正负关联规则 挖掘算法 数据挖掘
  • 简介:随着“互联网+”技术的不断发展,人们在大数据时代所产生的数据量也呈现出急速发展的趋势,面对如此复杂的、海量的数据,如何进行有用信息和数据的提取成为重要的问题,数据挖掘便成为关键,而关联规则则是数据挖掘中的重要组成部分,主要用于对数据集中项等之间联系的发现,对于从大数据中通过关联规则来进行挖掘已是最成熟且最活跃的研究方向之一。

  • 标签: 数据挖掘 关联规则 算法研究
  • 简介:关联规则是数据挖掘的重要方法之一,但传统的关联规则算法Apriori需要多次扫描数据库,需要很大的I/O开销,不能处理节点失效和负载均衡。云计算下的MapReduce模型能够处理节点失效并能做到负载均衡。将传统的关联规则算法Apriori进行改进,然后移植到Hadoop平台,提出了基于MapReduce编程的数据挖掘算法,它能高效的、并行的完成海量数据挖掘任务。通过实验验证了算法的有效性。

  • 标签: 云计算 数据挖掘 APRIORI算法 MAPREDUCE
  • 简介:近几年,由于电子商务迅猛发展,推荐系统逐渐成为了最热门的竞争手段。目前,推荐系统主要包括三个方面的推荐:热卖产品推荐、新产品上市推荐和相关产品推荐等。文章关注相关产品推荐,也就利用数据挖掘技术在大量的历史销售记录数据中进行挖掘,找出隐藏在不同的商品之间的相关信息,用动态网页的形式向用户推荐。文章采用FP—tree关联规则算法实现对客户信息的数据挖掘,并将其应用在推荐系统中。

  • 标签: 数据挖掘 关联规则 FP—tree算法 推荐系统
  • 简介:随着自动化和信息技术的应用,大量的生产实时数据被长期保存到企业信息系统中.充分挖掘这些数据背后蕴藏的信息和知识,对于优化生产过程、节能降耗和提高决策水平具有重要的价值.通过分析天津盘山电厂数据,以降低煤耗率为目的,使用关联规则算法对火电厂数据进行挖掘,并分析了各个参数对煤耗率的影响.

  • 标签: 数据挖掘 关联规则 实时数据
  • 简介:目的进行布鲁氏菌病相关危险因素研究,通过数据分析形成关联规则。方法采用关联规则算法(Apriori),对张北县养殖户2014—2015年的调查问卷资料进行分析,采用支持度和置信度作为衡量关联规则的强度。结果共形成30个强关联规则,这些强关联规则中蕴含着布病感染与性别、年龄、职业、从业年限、羊存栏量、羊购买地和戴手套情况等因素之间的关联关系。结论关联规则算法为评估布病危险因素提供了一套可借鉴的研究方法。

  • 标签: 布鲁氏菌病 数据挖掘 关联规则 APRIORI
  • 简介:摘要:农村电商的规模逐年增长,不过因为交通和信息的缺陷成本依然较高,尤其影响农村电商上行成本。本文研究了一种基于 FP-Growth关联规则的农村电商推荐算法算法以皮尔逊相关系数为基础对商品进行 K-means聚类,挖掘了潜在的连续购买关系,并据此推荐处于同区域内的若干相关商品。经离线评估,算法改进了订单撮合方法,提升上行订单的时间和空间集中度,降低了农村电商上行成本。

  • 标签: 农村电商 FP-Growth K-means 关联规则
  • 简介:摘要:本文率先介绍了关联规则算法的基础内涵,再通过专业的研究与分析,精准找出工业生产数据智能集成技术设计过程,包含处理冗余数据、明确数据集成过程、描述数据集成关联及识别数据频繁项等,根据工业生产数据智能集成技术设计状态,借助关联规则算法开展适当实践,规范工业生产数据的内在联系与智能集成效果,为工业生产数据建设奠定坚实基础。

  • 标签: 智能集成 工业生产数据 数据识别 关联规则算法
  • 简介:本文以面向大数据的高维数据挖掘技术为研究对象,运用邻接矩阵及其有向超图检测关联规则项之间的关系,探索了在大收据条件下关联规则冗余的检测法、基于生成树的分类去除算法,该算法能有效地提高关联规则的挖掘效率、降低实际处理所需要的时间。

  • 标签: 大数据 超图 冗余关联规则