简介:数据结构设计的重要目标之一是提高操作速度,特别是检索速度。局部平衡的红黑树、平衡的AVL树等二叉搜索树具有良好的检索性能,非常适合于基于内存的索引,但为防止树形结构退化为线性结构,在插入和删除结点时经常需要旋转,维护数据结构的操作比较复杂。文章阐述伸展树在检索过程中通过自动调整结构,使访问最频繁的结点靠近树结构的根,从而减少访问代价,指出伸展树可以作为各种线性序列的索引组织方法,能在一些需要高效索引的大工程中加以运用。
简介:
简介:在数据集中挖掘频繁模式是数据挖掘研究的关键环节之一。在过去,很多的努力都集中在独立数据的挖掘上。然而,现实世界中许多实体之间总会保持着千丝万缕的关系。如何获得这些关系的频繁模式,已逐渐成为近年来研究的一个目标,我们将它称之为频繁结构的挖掘。在数据挖掘中,一个重要的方法是关联规则挖掘。它被用来发现频繁出现在数据库事务中的项集;另一个重要的方法是序列挖掘,它的任务是去寻找一个项集的序列。这些挖掘任务都被称为频繁模式的挖掘。
简介:随着网络技术的发展,虚拟局域网(VLAN)在网络中的应用越来越广。为了更加有效的对VLAN进行管理,本文提出了一种基于、VLAN的网络拓扑发现算法,该算法基于生成树协议,通过获取每VLAN中的生成树信息.来推导出每VLAN的网络拓扑结构,从而达到管理的目的。
简介:描述了查询树的启发式优化方法,优化了文献[1]中的查询树,并分析了查询树的执行代价。
简介:通过扩充情感词典词基数,新建中立词词典,引入网络流行词等方式丰富情感词典,提高分词后情感词匹配的准确性;以某评价类网站网民评论作为原始数据进行分词,提取相应的正向情感分数,负向情感分数,中立情感词个数,评论情感总分值等特征,通过对连续数据的规约提炼离散属性,按照信息增益最大原则生成决策树进行评论的情感分类,去除小概率节点后进行两次实验,对好评的识别率达到90%,对差评的识别率达到92%。对中评的识别率达到75%。
简介:频繁模式的挖掘是数据挖掘领域中一个非常重要的问题,目前在高效、可扩展的频繁模式挖掘算法方面有大量研究。已有频繁模式挖掘算法大致分为两类:基于候选生成一测试策略的Apriori算法以及基于分而治之策略的频繁模式增长算法。已有的工作大多都假设待挖掘的数据是不变的。实际
简介:构件的合理分类是实现构件高效检索的基础和关键。针对目前应用广泛的刻面分类方法存在主观性因素的弊端,采用刻面分类和全文检索相结合的方法来描述构件。在此构件描述的基础上,利用聚类分析技术和语义分析技术提出一种基于语义的构件聚类索引树。并通过实验验证,该聚类索引树是可行的,有效地克服刻面分类方法的缺点,在一定程度上实现对构件的语义检索,而且具有较高的构件查全率和查准率。此外,用户在描述检索条件时,不再局限于限定的术语,更方便于普通用户。
简介:该文在描述决策树分类算法的基础上,叙述了决策树分类算法用于网络入侵检测领域,给出了决策树分类模型的构造过程,并说明了应用基于决策树模型检测入侵的过程。最后用KDDCUP99数据进行实验,验证了用本文描述的方法检测入侵行为的有效性。
简介:8月23日,工业和信息化部正式印发《信息化和工业化深度融合专项行动计划(2013-2018年)》,指出推动信息化和工业化深度融合是加快转变发展方式,促进四化同步发展的重大举措,是走中国特色新型工业化道路的必然选择。推动信息化和工业化深度融合,以信息化带动工业化,以工业化促进信息化,有利于破解当前发展瓶颈,实现工业转型升级。
简介:基于多类别肿瘤基因表达谱数据集,从研究肿瘤与正常组织的分类入手,对肿瘤分类特征基因选取问题进行分析和研究。将决策树算法应用到肿瘤基因表达谱分类研究中,尝试引入遗传算法,对决策树分类规则进行优化。试验结果表明,在样本有限的情况下,该方法比单个决策树具有更高的分类精度。
简介:有美丽,也有忧伤,有热烈如火,也有谷底徘徊--这就是爱的酸甜苦辣,总让人琢磨不透。倘若爱也有算术,将它作为加减乘除,那么答案到底会是什么?平时,拿这个去问一百个人也许就会得到一百种答案,但第到二月,当春天里的第一朵玫瑰绽开的时候,由于有了情人节,这个答案突然就变得明确起来。
简介:焦作历史上曾经以“煤城”著称。早在1893年英国人就来此开采煤矿,曾经因煤的储量丰富、质量上佳而享誉西方。经过100多年的开采,焦作煤储量大为减少,已是全国67个资源衰退型城市之一。从一个百年煤城到山水园林城市,-“黑”-“绿”之间,焦作市经历了怎样的观念转变和发展历程?
简介:37年前那场刻骨铭心的地震让所有人知道并记住了唐山这个名字,却很少有人知道,我国第一桶机制水泥、第一座成功的机械化矿井、第一条标准轨距铁路、第一台蒸汽机车和第一件卫生瓷也都诞生在这里。
简介:该文首先对决策树技术相关理论和SQLServer2008BI平台作了介绍,然后对用于挖掘分析的数据源进行了预处理。利用SQLServer2008BI平台下的决策树分类技术和DMX语言即数据挖掘扩展语言创建了课程成绩分析决策树模型。挖掘提升图和分类矩阵对该模型的评估结果表明模型具有较高的可靠性和分类准确度,同时模型对应的一些规则和模式可作为课程教学管理及改革的重要参考依据。
简介:Excel是一个优秀的电子表格软件,灵活应用能解决许多工作中的实际问题,但在数据录入时也会遇到一些具体问题。如怎样输入分数、怎样输入“001:002;003……”等。下面就介绍这个问题如何解决。一、正确输入分数首先选定要输入分数的单元格,然后输入一个阿拉伯数字“0”,再按下一个空格,这时再输入分数如3/4就会正确显示在屏幕上,若不按上述方法输入,直接在单元格中输入3/4,就会显示出3月4日格式来,这是我们不需要的,操作时特别注意,不过有一点例外,凡不在月日范围之内的就可以直接输入。
简介:提起中国香港的安东尼奥公司,很多人可能都是一头雾水。但是提起ATA耳机,一些朋友可能就有印象了。安东尼奥公司生产的ATA耳机在国内市场并不多见,但在国际市场上的名气不小。特别是它为很多家电与IT公司生产OEM产品,年销售额非常大。前不久,ATA
“伸展树——一种高效的索引树”教学设计
树中观潮
Chopper:有效的树挖掘算法
基于生成树协议的VLAN管理
查询树的启发式优化研究
基于决策树的网民评价情感分析
基于频繁模式树的频繁模式高效增量维护
一种改进的构件聚类索引树的研究
决策树在网络入侵检测中的研究与应用
两化融合看河北——两化融合:河北在行动
基于遗传算法优化决策树的肿瘤基因分类研究
求证爱的“乘除加减”——情人节“他和她”系列本本导购
焦作的“两化”经济演进论
河北“两化”看唐山
两“小”无猜迷你闪盘
基于决策树技术和SQL Server BI平台的课程成绩分析
Excel—输入技巧两则
两款最新ATA耳机
简单两三步,设计自己风格的信纸
KV2003的两种新玩法