学科分类
/ 1
5 个结果
  • 简介:目前大多数自动标引方法不能有效利用文本中包含的多个特征。而支持向量机、条件随机场模型等统计机器学习模型能够有效利用文本包含的多种特征进行关键词提取。同时,由于各种自动标引模型性能各异,综合利用各种模型进行集成学习方式的自动标引,能够提高自动标引的质量。为了进一步提高自动标引的质量,本文试图整合统计机器学习模型与集成学习方法的优势,对文档进行基于多分类模型综合投票方式的自动标引。实验结果表明,基于集成学习方法的自动标引能提高标引结果的查准率和召回率。另外,集成学习标引模型中,基分类器加权的标引结果,优于基分类器未加权的标引结果。

  • 标签: 自动标引 关键词提取 集成学习
  • 简介:阐述清初谭吉璁与《肃松录》、《丛书集成三编》与《肃松录》和《嘉兴谭氏遗书》与《肃松录》的内在联系,对难见《肃松录》原本的原因进行推断。

  • 标签: 丛书集成三编 肃松录 谭吉璁 谭新嘉 明帝陵
  • 简介:文章分析了数据库备份的重要性,介绍了两种自动备份SQLServer数据库的方法,并提供了两种异机存放备份文件的具体方案。

  • 标签: 图书馆 数据库 自动备份