简介:中文文献数据库中存在大量的分类号与关键词(或主题词)对应的人工标引记录。通过对这些标引记录信息进行聚合处理,可以实现计算机自动编制分类主题词表。作者比较了两种分类主题词表的编制模式,讨论了机编分类主题词表的优势,针对机编分类主题词表已有的成果——知识库的不足之处提出改进方案。改进方案在小规模测试集中取得了良好的效果。文章最后还分析了将机编分类主题词表技术应用于新一代《中国分类主题词表》升级改造的良好前景。
分类主题词表的计算机自动编制——兼论用于自动分类的知识库的改进