简介:总结国内外专利文本分类情况,简要叙述基于机器学习的专利文本分类的-般框架,介绍专利文本分类的文本预处理、特征提取、文本表示、分类器构建及效果评价等过程.将应用于专利文本分类的机器学习算法分为单-分类算法和组合分类算法着重探讨单-分类算法主要有NB算法、ANN算法、Rocchio算法、KNN算法、SVM算法等;组合分类算法主要有两种组合算法,如NB-KNN算法、Rocchio-KNN算法、KNN-SVM算法、SVM-其它算法,还有多种组合算法.指出各种机器学习算法应用在专利文本分类上的优势与不足,从专利文本预处理、特征提取、专利文本表示、分类器的构建、新方法的探索等五个方面对专利文本自动分类技术进行展望.
简介:《知识组织文献分类表》系国际知识组织学会(ISKO)创始人IngetrautDahlberg博士为1974年创刊的《国际分类》杂志“分类法文献”栏目编纂的。1993年在该刊发表时,Dahlberg职博士在前面增加了一个导言。本表的许多类目可以根据学科或专业进行复分(以*标示),复分的依据是Dahlberg博士编纂的另一部分类表——《信息编码分类表》(ICC)。在多数情况下,ICC代码与《知识组织文献分类表》代码结合时需加“一”,只有5—6大类直接按ICC复分。例:“048—51/4医学叙词表”,而“651/4有关医学叙词表的文献”。本表根据《知识组织》杂志1999年第4期刊登的修订版译出。该刊编辑根据知识组织领域研究的进展,对类目作了少许更动,并将《信息编码分类表大纲》附在表后,以便对照、使用。
简介:《隋书·经籍志》是我国现存最早的四部分类书目,但《隋志》分类也有编次不当之处,于是姚振宗在其《〈隋书·经籍志〉考证》中对《隋志》进行了“类中分类”。文章从“类中分类”的缘起、特点及意义等方面对姚振宗的分类法做一初步的探讨。
简介:Folksonomy是一种自底向上、用户可以自由参与的分类方法,但随着标签数量的不断增加,Folksonomy的进一步发展受到制约。通过对Folksonomy的概述以及对其改进的国内外研究现状介绍,着重从提取Folksonomy中的本体、扩展Folksonomy的语义关系、融合Folksonomy与本体三个维度分析本体在Folksonomy改进研究中发挥的作用。在总结国内外基于本体的Folksonomy的研究成果的基础之上,对未来基于本体的Folksonomy研究方向提出建议:注重自然语言聚类与协作标签系统的作用,关注计算机技术与标签本体构建的结合,尝试外部本体词表的引入,拓展Folksonomy的应用范围。
简介:马克思主义在《中图法》各版本中的类目名称、体系结构以及地位不断变化,其相关学术争论也一直不断。针对《中图法》第4版A大类列类存在的大类类名、体系、依人列类、著作复分体例、文献保证等问题,提出将此大类与Z综合性图书大类合并,改造为总类或综合性大类的全新修订与改造方案。