简介:目前大多数自动标引方法不能有效利用文本中包含的多个特征。而支持向量机、条件随机场模型等统计机器学习模型能够有效利用文本包含的多种特征进行关键词提取。同时,由于各种自动标引模型性能各异,综合利用各种模型进行集成学习方式的自动标引,能够提高自动标引的质量。为了进一步提高自动标引的质量,本文试图整合统计机器学习模型与集成学习方法的优势,对文档进行基于多分类模型综合投票方式的自动标引。实验结果表明,基于集成学习方法的自动标引能提高标引结果的查准率和召回率。另外,集成学习标引模型中,基分类器加权的标引结果,优于基分类器未加权的标引结果。
简介:从1984年起,广西大学古籍整理研究室(后改为研究所)开始编制《古今图书集成索引》。经过二十多年的努力,取得了油印本、印刷本、电子版、网络版等阶段性成果。
简介:一、研究成果的主要内容本项目的成果是电子版《古今图书集成索引》2.0版,刻在一张CD—ROM上。
简介:阐述清初谭吉璁与《肃松录》、《丛书集成三编》与《肃松录》和《嘉兴谭氏遗书》与《肃松录》的内在联系,对难见《肃松录》原本的原因进行推断。
简介:文章分析了数据库备份的重要性,介绍了两种自动备份SQLServer数据库的方法,并提供了两种异机存放备份文件的具体方案。
简介:随着图书情报事业的发展,人们对信息资源共享的需求正在迅速增长。以前很流行的单用户的DBSAE数据库由于其在数据共享方面存在许多局限性,必然被性能更为优良的多用户数据库系统所替代。现在多用户数据库系统种类很多,其中的INFORMIX数据库系统,其数据独立性强,
简介:提高图书馆Web服务器的访问速度成为提高图书馆服务质量的重要一环。文章通过对提高Web服务器访问速度影响因素和现有加速技术的分析,提出采用综合性的方法来提高Web服务器的访问速度。
简介:虚拟化技术是图书馆解决其因为服务器增多而带来管理维护困难的重要手段。文章介绍并比较了市场上主流的虚拟化产品,提出选择使用VMwarevSphere6.5对图书馆数据中心的服务器进行虚拟化改造。
简介:总结目前较流行的电子阅读器的四种商业模式:“终端+内容”、“终端+平台”、“终端+内容+平台”和“终端+服务”.然后,从设备和服务两方面分析图书馆引入电子书阅读器的难点.在此基础上,提出图书馆电子书阅读器的三种服务模式:“平台-自助”模式、“内容-承包”模式以及“用户驱动采购”模式,从具体服务模式及核心要素、优缺点及局限性、适用范围几方面对这三种服务模式进行分析和比较,认为用户驱动采购(PDA)模式是图书馆与资源出版服务商共同的努力方向.
简介:介绍了服务器虚拟化技术,探讨了服务器虚拟化结合刀片服务器在数字图书馆应用中的各种优势,并结合该馆实际情况,设计并实施了哈尔滨工程大学图书馆的服务器虚拟化方案。
简介:文章论述了便携式条码数据采集器特点及其在图书采购自动化管理中的应用,进而提出采集器在现购中存在的问题及应对措施。
简介:针对目前图书馆服务器能源消耗量大的现状,分析虚拟机技术的主要应用优势,提出将虚拟机应用在图书馆低碳化服务过程中,以降低服务器及外围设备的能源消耗,充分满足不同应用方式对系统资源的多种要求,提高图书馆服务器资源的利用率。并以安徽行政学院为例,探讨虚拟机服务配置及使用情况,分析虚拟机在区域图书馆低碳化服务中的应用前景。
基于集成学习的自动标引方法研究
《古今图书集成索引》网络版推出
电子版《古今图书集成索引》2.0版简介
《丛书集成三编》之《肃松录》版本举正
图书馆集成系统数据库的自动备份与异机备份
DBASE数据库文件向INFORMIX数据库文件的转换方法
综合提高图书馆Web服务器的访问速度
服务器虚拟化技术在图书馆的应用
图书馆电子书阅读器服务模式探析
vSphere结合刀片服务器在数字图书馆中的应用
条码数据采集器在图书采购自动化管理中的应用
虚拟机在图书馆服务器低碳化服务中的应用与推广——以安徽行政学院图书馆为例