文本聚类技术作为处理和组织大量文本数据的一项重要技术,能够在很大程度上解决由于信息爆炸所带来的问题。Sollin算法是构建最小生成树的典型算法,与Kruskal算法和Prim算法相比,具有容易实现并行运算的特点。因此,利用基于Sollin的快速层次聚类算法在复旦语料和搜狗语料上进行聚类实验,结果表明基于Sollin的快速层次聚类算法在运行效率和聚类质量上都优于传统层次聚类算法。
船舶职业教育
2015年1期