学科分类
/ 1
12 个结果
  • 简介:总结国内外专利文本分类情况,简要叙述基于机器学习的专利文本分类的-般框架,介绍专利文本分类的文本预处理、特征提取、文本表示、分类器构建及效果评价等过程.将应用于专利文本分类的机器学习算法分为单-分类算法和组合分类算法着重探讨单-分类算法主要有NB算法、ANN算法、Rocchio算法、KNN算法、SVM算法等;组合分类算法主要有两种组合算法,如NB-KNN算法、Rocchio-KNN算法、KNN-SVM算法、SVM-其它算法,还有多种组合算法.指出各种机器学习算法应用在专利文本分类上的优势与不足,从专利文本预处理、特征提取、专利文本表示、分类器的构建、新方法的探索等五个方面对专利文本自动分类技术进行展望.

  • 标签: 专利文本 自动分类 机器学习 朴素贝叶斯 支持向量机
  • 简介:依照Web2.0的“社会化标注”思想,针对基于内容的推荐算法(cBR)和协同过滤推荐算法(CF)存在的不足,提出了基于读者标签(Tags)的、融合图书“热门度”因子的个性化图书推荐的两个改进算法。利用统计分析软件R,重点对改进后的CBR算法进行实验分析和验证,结果表明,改进算法的图书个性化推荐效果有明显改善。

  • 标签: 图书个性化服务 推荐算法 标签 热门度
  • 简介:网页去重是提高网络检索效果的有效途径。针对现有网页去重算法的不足和网页正文的结构特征,提出一个基于网页正文逻辑段落和长句提取的网页去重算法。该方法通过用户检索关键词将网页正文物理段落结构表示成逻辑段落,在此基础上提取逻辑段落中的长句作为网页特征码实现相似网页判断。实验证明,该方法提高了篇幅短小的镜像网页和近似镜像网页的去重效果。

  • 标签: 网页去重 逻辑段落 长句提取 句子相似度
  • 简介:在搜索引擎的检索结果页面中,用户经常会得到内容相似的重复页面,它们中大多是由于网站之间转载造成的。为提高检索效率和用户满意度,提出一种基于特征向量的大规模中文近似网页检测算法DDW(Detectnear—DuplicateWebPages)。试验证明,比起其他网页去重算法(I—Match),DDW具有很好的抵抗噪声的能力及近似线性的时间和空间复杂度,在大规模实验中获得良好测试结果。

  • 标签: 网页去重算法 特征向量 近似网页 支持向量机
  • 简介:高职院校的图书采购是否有必要采用招投标方式集中采购,是否有必要依赖书商,这些问题都值得探讨。积极采用询价采购、分散采购是改进高职院校图书采购的有效途径;坚持专业图书真正由专业人员采选,才能切实提高图书质量。

  • 标签: 图书采购 采购模式 高职院校
  • 简介:Folksonomy是一种自底向上、用户可以自由参与的分类方法,但随着标签数量的不断增加,Folksonomy的进一步发展受到制约。通过对Folksonomy的概述以及对其改进的国内外研究现状介绍,着重从提取Folksonomy中的本体、扩展Folksonomy的语义关系、融合Folksonomy与本体三个维度分析本体在Folksonomy改进研究中发挥的作用。在总结国内外基于本体的Folksonomy的研究成果的基础之上,对未来基于本体的Folksonomy研究方向提出建议:注重自然语言聚类与协作标签系统的作用,关注计算机技术与标签本体构建的结合,尝试外部本体词表的引入,拓展Folksonomy的应用范围。

  • 标签: FOLKSONOMY 本体 标签 改进
  • 简介:《中图法》第3版是国内影响很大的一部分类法,1990出版,目前全国90%以上的图书情报部门都已使用《中图法》类分图书资料。《中图法》第3版在类目设置、标记符号以及类目注释等方面都颇具特色。据初步统计:《中图法》主表总类目数达29393个,其中社科8103个,自科20616个。主表下类目注释共10157条,其中社科2645条,自科7512条。另有59个专类复分表共有子目677个,子目下设有类目注释134条。尽管《中图法》

  • 标签: 类目注释 中图法 主题概念 文献分类法 新学科 类目设置
  • 简介:介绍高校图书馆数字资源采购的三种常见付费模式,即大宗交易、按学科主题采购和按次计费,并分析三种模式各自的优缺点,以Emerald、Jstor、Springer数据库为例,对贵州财经大学图书馆数字资源实际使用情况进行具体分析,提出基于图书馆具体使用状况的更加精细化的采购模式改进方案:按品种组合资源包,根据学校重点学科购买和按篇购买,并进行了可行性论证。

  • 标签: 高校图书馆 数字资源采购 改进
  • 简介:文献评奖是我国新闻出版行业的重要活动。介绍了我国著名的文献奖项,分析了我国文献评奖的现状及存在的问题,在此基础上提出了完善文献评奖标准、健全文献评奖程序、完善文献评奖审察制度、提升文献评奖影响力共四点建议。

  • 标签: 新闻出版 文献评奖 奖项 现状 改进
  • 简介:文章对2011-2012学年南京航空航天大学图书馆读者留言进行了整理和分析,针对读者对资源需求、检索技术和图书馆管理制度等方面提出的各种意见,提出图书馆可采取的各项改进策略和措施,促进图书馆服务工作的创新和可持续性发展。

  • 标签: 图书馆服务 读者留言 改进策略
  • 简介:中小学图书馆在教育教学中的作用是不容置疑的,被誉为信息中心,知识的补给站.学生的第二课堂,然而在实际工作中.其职能作用的发挥受着诸多因素的制约。

  • 标签: 中小学图书馆 图书馆职能 改进措施
  • 简介:中文文献数据库中存在大量的分类号与关键词(或主题词)对应的人工标引记录。通过对这些标引记录信息进行聚合处理,可以实现计算机自动编制分类主题词表。作者比较了两种分类主题词表的编制模式,讨论了机编分类主题词表的优势,针对机编分类主题词表已有的成果——知识库的不足之处提出改进方案。改进方案在小规模测试集中取得了良好的效果。文章最后还分析了将机编分类主题词表技术应用于新一代《中国分类主题词表》升级改造的良好前景。

  • 标签: 中国分类主题词表 中国图书馆分类法 分类主题词表 计算机辅助编制 知识库 自动分类