简介:随着网络信息量的激增,人们对信息质和量需求的提高也促进了信息获取方法的空前发展。一种新兴的网络信息分类法——Folksonomy应运而生。本文将对其产生、发展以及具体特点进行深入分析,由此指出它对现有的网络信息分类带来的影响,并对自由分类法的发展提出了建议。
简介:总结国内外专利文本分类情况,简要叙述基于机器学习的专利文本分类的-般框架,介绍专利文本分类的文本预处理、特征提取、文本表示、分类器构建及效果评价等过程.将应用于专利文本分类的机器学习算法分为单-分类算法和组合分类算法着重探讨单-分类算法主要有NB算法、ANN算法、Rocchio算法、KNN算法、SVM算法等;组合分类算法主要有两种组合算法,如NB-KNN算法、Rocchio-KNN算法、KNN-SVM算法、SVM-其它算法,还有多种组合算法.指出各种机器学习算法应用在专利文本分类上的优势与不足,从专利文本预处理、特征提取、专利文本表示、分类器的构建、新方法的探索等五个方面对专利文本自动分类技术进行展望.
简介:由于《中国图书馆分类法》的类目数目庞大和文献在各类目上分布的不均衡,导致基于机器统计学习的自动分类技术在此类多层分类上的力不从心。基于人工标引经验的自动分类试图通过情报检索语言兼容互换的原理解决这一问题,然而直接应用标引词串对分类进行匹配在实际应用中产生了一系列的问题。本文试图通过两种分类技术相结合的方法对信息资源进行分类,提出了用相关度度量来测定关键词和类目概念之间的关联,构建关键词、分类号、归属度三元组矩阵的方法进行分类匹配,并在小规模的测试集上得到了较好的效果。本文详细讨论此种分类器的构建原理、构建方法以及分类流程,并对该方法存在的不足进行了分析。
简介:[目的/意义]揭示京津冀地区高校专利合作网络结构特征演化的过程,反映京津冀地区高校合作专利发展现状,为京津冀地区的资源配置及相关政策的制定提供科学的决策支持。[方法/过程]以京津冀高校近32年申请的发明专利为研究对象,运用社会网络分析法绘制京津冀地区所在高校与企业、科研院所及高校之间的产学研专利合作网络,分析网络形态特征、合作频次、网络整体结构特征与节点中心性的演化情况。[结果/结论]京津两地高校以及能源领域央企集团对京津冀产学研专利合作产生的作用很大,河北高校的中介作用很弱。针对这一演化特征,建议加强企业创新主体地位,激发中小企业的自主创新能力;加强创新链与产业链对接,促进京津冀创新成果转化;发挥京津两地高校与科研院所对河北的创新辐射作用;积极促进河北高校与京津两地高校的协同发展。
简介:《知识组织文献分类表》系国际知识组织学会(ISKO)创始人IngetrautDahlberg博士为1974年创刊的《国际分类》杂志“分类法文献”栏目编纂的。1993年在该刊发表时,Dahlberg职博士在前面增加了一个导言。本表的许多类目可以根据学科或专业进行复分(以*标示),复分的依据是Dahlberg博士编纂的另一部分类表——《信息编码分类表》(ICC)。在多数情况下,ICC代码与《知识组织文献分类表》代码结合时需加“一”,只有5—6大类直接按ICC复分。例:“048—51/4医学叙词表”,而“651/4有关医学叙词表的文献”。本表根据《知识组织》杂志1999年第4期刊登的修订版译出。该刊编辑根据知识组织领域研究的进展,对类目作了少许更动,并将《信息编码分类表大纲》附在表后,以便对照、使用。