简介:传统的生物医学命名实体识别方法需要大量的标注数据样本,但是在实际应用中标注样本代价高昂。为降低生物医学命名实体识别对标注样本的需求,本文提出通过使用PU学习中的两步法方法,将生物医学命名实体识别问题转化为PU场景下的命名实体识别问题。在第一步中分别使用1-DNF、Spy、NB和Rocchio算法在未标注数据中抽取强负例,然后在已有的正例数据和强负例数据的基础上构建隐马尔可夫模型,最后对待分类数据进行命名实体识别。在GENIA语料库上的实验结果显示,在标注数据较少的情况下,通过使用PU学习方法的两步法构建分类模型,其性能显著优于直接使用标注数据构建的分类模型,同时降低了人工标注数据的成本。
简介:《智能物联技术》(ISSN2096-6059,CN33-1411/TP)是由中国电子科技集团公司主管、中电海康集团有限公司(中国电子科技集团公司第五十二研究所)主办的面向国内外公开发行的中文双月刊,创刊于1977年,曾用名《电子计算机与外部设备》《电子计算机外部设备》《新电脑》,1992年、1996年连续人选北京大学《中文核心期刊要目总览》来源期刊。
简介:《智能物联技术》(ISSN2096-6059,CN33-1411/TP)是由中国电子科技集团公司主管、中电海康集团有限公司(中国电子科技集团公司第五十二研究所%主办的面向国内外公开发行的中文双月刊,创刊于1977年,曾用名《电子计算机与外部设备》《电子计算机外部设备》《新电脑》,1992年、1996年连续入选北京大学《中文核心期刊要目总览》来源期刊。
简介:《智能物联技术》(ISSN2096-6059,CN33-1411/TP)是由中国电子科技集团公司主管、中电海康集团有限公司(中国电子科技集团公司第五十二研究所%主办的面向国内外公开发行的中文双月刊,创刊于1977年,曾用名《电子计算机与外部设备》《电子计算机外部设备》《新电脑》,1992年、1996年连续入选北京大学《中文核心期刊要目总览》来源期刊。