简介:总结国内外专利文本分类情况,简要叙述基于机器学习的专利文本分类的-般框架,介绍专利文本分类的文本预处理、特征提取、文本表示、分类器构建及效果评价等过程.将应用于专利文本分类的机器学习算法分为单-分类算法和组合分类算法着重探讨单-分类算法主要有NB算法、ANN算法、Rocchio算法、KNN算法、SVM算法等;组合分类算法主要有两种组合算法,如NB-KNN算法、Rocchio-KNN算法、KNN-SVM算法、SVM-其它算法,还有多种组合算法.指出各种机器学习算法应用在专利文本分类上的优势与不足,从专利文本预处理、特征提取、专利文本表示、分类器的构建、新方法的探索等五个方面对专利文本自动分类技术进行展望.
简介:2017年数据一览国际图联成员:1293个成员(包括国家和国际协会、机构、组织和个人)137个国家IFLA全球视野在线投票:21772次在线投票190个联合国成员国7大洲世界图书馆地图(LMW)项目:210万个图书馆105个国家参与LMW项目126个组织对LMW项目做出了贡献2017年世界图书馆与信息大会(WLIC):3100多名代表500多个发言人247个研讨会国际图联战略规划:强有力的治理战略支持国际图联战略规划阐述了2016-2021年的战略方向和目标,旨在指导国际图联的治理和活动。2016-2021年,国际图联管理委员会制定了四个战略方向,并通过一系列重要举措和活动来推进。
简介:由于《中国图书馆分类法》的类目数目庞大和文献在各类目上分布的不均衡,导致基于机器统计学习的自动分类技术在此类多层分类上的力不从心。基于人工标引经验的自动分类试图通过情报检索语言兼容互换的原理解决这一问题,然而直接应用标引词串对分类进行匹配在实际应用中产生了一系列的问题。本文试图通过两种分类技术相结合的方法对信息资源进行分类,提出了用相关度度量来测定关键词和类目概念之间的关联,构建关键词、分类号、归属度三元组矩阵的方法进行分类匹配,并在小规模的测试集上得到了较好的效果。本文详细讨论此种分类器的构建原理、构建方法以及分类流程,并对该方法存在的不足进行了分析。
简介:本文通过对《中图法》第2~4版索引编制技术的比较,总结了分类法索引的编制从单一技术到多种技术相结合、从纯手工编制到计算机编制逐渐演变的发展趋势,论述了用计算机编制索引的优越性。
简介:《中国图书馆图书分类法》(简称《中图法》),自1975年出第一版以来,经过两次修订,已于1990年出版了第三版。它的问世是在十多年的图书馆文献分类实践的基础上,进一步加以充实、完善和提高。因此,《中图法》第三版受到了图书馆等文献工作部门的欢迎,它必将促使文献分类工作更趋于科学、准确和统一。