简介:目前大多数自动标引方法不能有效利用文本中包含的多个特征。而支持向量机、条件随机场模型等统计机器学习模型能够有效利用文本包含的多种特征进行关键词提取。同时,由于各种自动标引模型性能各异,综合利用各种模型进行集成学习方式的自动标引,能够提高自动标引的质量。为了进一步提高自动标引的质量,本文试图整合统计机器学习模型与集成学习方法的优势,对文档进行基于多分类模型综合投票方式的自动标引。实验结果表明,基于集成学习方法的自动标引能提高标引结果的查准率和召回率。另外,集成学习标引模型中,基分类器加权的标引结果,优于基分类器未加权的标引结果。
简介:随着科学技术日新月异地高速发展,反映科学技术发展的文献量在呈爆炸式增长,旧的文献加工处理模式已不能适应这一新的形势。这就迫切要求文献信息部门建立一种新的文献加工处理模式,而计算机在各个领域的广泛应用为我们创造了条件,使图书情报事业得到了飞跃发展,图书馆业务工作中很多过去由手工来完成的工作已由计算机逐
简介:题目学科分类对海量题库的汇聚和应用有着重要意义。本文提出的二次分类方法能有效提高分类正确率,尤其针对那些容易混淆的学科,作了进一步的优化处理。
简介:题目学科分类对海量题库的汇聚和应用有着重要意义。本文提出的二次分类方法能有效提高分类正确率,尤其针对那些容易混淆的学科,经过进一步的优化处理,取得比较显著改进效果。
简介:笔者在图书馆的基层工作中兼管读者遗失图书我赔书工作、发现有些读者的赔书,实际上是在“买书”。因为图书并没有遗失,而是读者想占为己有,不原归还了,于是向我们声称:书已遗失,原来赔偿。为什么会出现读者“买书”现象呢?据分析,不外乎有这几种原因:
简介:随着我国改革开放的深入和WTO的加入,迅速提高我国国民素质和教育水平就成为我们的一个重要任务。建设一个现代化的高等教育体系,首先需要建设一批有着先进教学和管理理念以及完善的教学基础设施的高等院校,而高校图书馆作为高校的三大支柱之一,已经成为了衡量和评价一个高校是否先进的标志。特别是在21世纪,知识与信息的传播速度越来越快,数字化信息大量普及,高校图书馆在信息资源与读者之间扮演的角色也越来越重要。它将
简介:本文针对DIPS系统中对象文件加工入库的方法,需要对字段数据进行处理和加工,而传统做法是一条条地加工处理,费时又费力,利用字段数据批处理技巧能在短时间内加工处理成"标准文本格式"数据,有利于提高工作效率。
简介:图书内容索引在我国的普及程度不高,很大一个原因是我国的索引编制工作没有实现自动化,索引编制的效率不高。本文在对目前国内两款使用频率较高的索引编制软件——Word和索引之星的索引功能进行分析之后,设计了图书内容索引编制系统(BIS),该系统吸收了Word和索引之星软件的设计经验,并克服其在编制索引功能上存在的不足,最后对系统实现的相关技术问题进行了讨论。
简介:我不懂心理学和美学,不过,我知道,在索引版面中,的确存在着心理学和美学现象。当我们进行索引版面设计时,若能考虑到这方面,就可提高索引的品位。
简介:学生用户在利用电子阅览室过程中时常有违规的现象发生。通过对违规现象的分析,提出一些具有针对性的防范措施。
简介:针对图书馆在开架借阅中出现的乱架毁书现象,文中提出了6条改进意见。
简介:新闻标题具有特殊性,为适应编制索引与数据库的需要,必须对某些新闻标题进行改写。本文阐述新闻标题改写的原则和方法。
简介:人们按照传播媒介方式的不同把媒体的发展划分为四个不同的阶段,纸媒介的报纸、电波媒介的广播、基于电视图像传播的电视分别被称为第一、第二和第三媒体(传统媒体),而伴随Internet的迅速发展,新兴的基于互联网传输的网络媒体(又称数字化媒
简介:随着改革的不断深入,社会经济的迅速发展,作为信息传播中介机构的图书馆,在工作量急骤增大的同时,对其功能也提出了许多新的要求。进入90年代,信息技术在我国的图书馆获得广泛的应用,尤其是近年来计算机网络的普及,这一切在给图书馆现代化带来无限生机的同时,也提出了许多新的挑战。
简介:为了使一些国家地质科技情报的服务统一在一个整体化的格局内,要求综合解决科学、方法、技术和组织等方面的问题,应在拟定解决方案时必须考虑由于国际上及建立的系统的情况而产生的诸多因素和条件。
简介:图书馆自动化建设,是一项高科技、高投入的建设。也是一项见效快、效益高的建设。作为占全国三分之二以上数量的中小型高校图书馆,如何抉择,如何运作,是一个非常值得研究的课题。在此,仅就我院图书馆自动化建设的思路和做法,谈一点看法:1思路与实践我院图书馆自动化建设,因为学校专业单
简介:文章分析了数据库备份的重要性,介绍了两种自动备份SQLServer数据库的方法,并提供了两种异机存放备份文件的具体方案。
简介:继续教育工作作为基础教育的一种延伸、补充和拓展,在解决图书馆人才问题上将起到不可忽视的作用。把握当前图书馆事业的发展重点和热点的任务之一,就是要将继续教育放在研究辅导部门工作的首位,要让每位馆员在21世纪里都能坚持终身学习,继续深造,努力将辅导部门营造成图书馆员的'加油站'。1当前业务辅导部门工作中存在的几个问题当前,由于辅导部门主观上对图书馆员的
简介:信息无障碍运动发展十年来,为残障人群融入社会、奉献社会和构建和谐社会作出了重要贡献,但是对于残障人群来说,信息障碍仍然存在。基于此,文章通过信息无障碍检测工具评估我国各类与残障人群密切相关的网站的无障碍现状,并与以前的评测结果相比较,据此分析现阶段我国信息无障碍存在的问题及原因,并提出了应对措施和解决办法。
简介:自1983年日本首次开发成功CD-ROM只读光盘机以来,经过短短10余年的应用开发,光盘以其独特的优势很快占领了市场,并受到各种用户的普遍欢迎.又由于光盘易于同微型计算机相连接而进行随机检索,它向联机情报检索系统这种庞然大物提出了有力
基于集成学习的自动标引方法研究
中文同类书区分自动化系统
一种学科题目文本自动分类方法
浅谈读者的“买书”现象及对策
高校图书馆自动化网络系统设计之我见
数据库字段数据批处理技巧探讨——基于DIPS系统中“标准文本格式”数据的高效加工方法
图书内容索引编制系统(BIS)设计探讨
索引版面中的心理学和美学现象
电子阅览室学生用户常见违规现象分析
加强开架管理,避免乱架毁书现象
关于新闻标题改写原则与方法的探讨
网络媒体与传统媒体的“耗散现象”浅析
面向对象分析方法在图书管理系统中的应用
网络环境下自动化文献情报检索系统语言手段浅析
中小型高校图书馆自动化系统建设的思路
图书馆集成系统数据库的自动备份与异机备份
图书馆员的“加油站”——研究辅导部
信息无障碍十年:现状、问题和应对策略
CD-ROM光盘在我国信息领域中应用的障碍