一个K-均值文档聚类的改进算法

在线阅读 下载PDF 导出详情
摘要 k均值算法是一个常用的局部搜索算法,它的主要缺陷是容易陷入局部极小,并且该局部极小解与全局最优解往往有很大的偏差.本文提出一个基于K-均值的迭代局部搜索文档聚类算法.该算法以k均值算法所得到的解作为初始解,从该初始解开始作局部搜索,在搜索过程中接受部分劣解.当解无法改进时,算法对所得到的局部极小解做适当强度的扰动后进行下一次的迭代,以跳出局部极小,从而拓展了搜索的范围.实验结果表明该算法对文档数据集聚类的正确性达99%以上.
机构地区 不详
出处 《闽江学院学报》 2004年2期
出版日期 2004年02月12日(中国期刊网平台首次上网日期,不代表论文的发表时间)
  • 相关文献