简介:本文指出在现代科技高度发展的今天,图像资料具有用途广泛、直观、生动的特点,有着文字资料无法替代的作用。因此编制图像索引很有必要,但目前太少,如利用电脑等先进手段加以推广,进而建立覆盖面越来越大的书本式索引或光盘式数据库,将使图像资源的利用率大大提高。
简介:总结国内外专利文本分类情况,简要叙述基于机器学习的专利文本分类的-般框架,介绍专利文本分类的文本预处理、特征提取、文本表示、分类器构建及效果评价等过程.将应用于专利文本分类的机器学习算法分为单-分类算法和组合分类算法着重探讨单-分类算法主要有NB算法、ANN算法、Rocchio算法、KNN算法、SVM算法等;组合分类算法主要有两种组合算法,如NB-KNN算法、Rocchio-KNN算法、KNN-SVM算法、SVM-其它算法,还有多种组合算法.指出各种机器学习算法应用在专利文本分类上的优势与不足,从专利文本预处理、特征提取、专利文本表示、分类器的构建、新方法的探索等五个方面对专利文本自动分类技术进行展望.