简介:总结国内外专利文本分类情况,简要叙述基于机器学习的专利文本分类的-般框架,介绍专利文本分类的文本预处理、特征提取、文本表示、分类器构建及效果评价等过程.将应用于专利文本分类的机器学习算法分为单-分类算法和组合分类算法着重探讨单-分类算法主要有NB算法、ANN算法、Rocchio算法、KNN算法、SVM算法等;组合分类算法主要有两种组合算法,如NB-KNN算法、Rocchio-KNN算法、KNN-SVM算法、SVM-其它算法,还有多种组合算法.指出各种机器学习算法应用在专利文本分类上的优势与不足,从专利文本预处理、特征提取、专利文本表示、分类器的构建、新方法的探索等五个方面对专利文本自动分类技术进行展望.
简介:由于《中国图书馆分类法》的类目数目庞大和文献在各类目上分布的不均衡,导致基于机器统计学习的自动分类技术在此类多层分类上的力不从心。基于人工标引经验的自动分类试图通过情报检索语言兼容互换的原理解决这一问题,然而直接应用标引词串对分类进行匹配在实际应用中产生了一系列的问题。本文试图通过两种分类技术相结合的方法对信息资源进行分类,提出了用相关度度量来测定关键词和类目概念之间的关联,构建关键词、分类号、归属度三元组矩阵的方法进行分类匹配,并在小规模的测试集上得到了较好的效果。本文详细讨论此种分类器的构建原理、构建方法以及分类流程,并对该方法存在的不足进行了分析。
简介:明确同济大学图书馆在“十三五”时期的使命和愿景.然后,根据国内外图书馆行业发展现状和环境扫描,立足同济大学的未来发展方向和用户需求,分析和把握研究型大学图书馆发展趋势,结合发展现状和已有建设成果,提出同济大学图书馆未来发展的六大目标,即未来五年将同济大学图书馆建设成为支撑学科建设、科学研究和人才培养的“文献保障与共享中心”,助力科学决策和科研创新的“情报分析与服务中心”,引领文化风尚和经典阅读的“文化传承与交流中心”,促进自觉学习和创新实践的“创新体验与学习中心”,培养研究型学习习惯和批判性思维的“信息素养教育基地”,推进可持续发展和科学管理的“研究型大学图书馆”.分别阐述这六大目标中每一项目标的总目标、分目标和行动计划.最后,分析“十三五”目标实现的保障措施及预期效果.
简介:补:1999年6月3日,汉川市淡水养殖图书馆通过社会捐书活动,收集到民间收藏的有价值的特色文献300余册。补:1999年6月5日,黄石市服装图书馆举办了'99服装特色'专题讲座,有88名服装技术人员和服装爱好者参加。补:1999年6月22日,湖北省文化厅周