学科分类
/ 1
9 个结果
  • 简介:本文详细介绍了中文文本自动校对的研究现状,包括文本中错误的分类,中文自动校对中常用的语言模型,以及一些有代表性的工作.作为参考,本文还介绍了英文拼写检查的方法,比较了中英文自动校对的异同并重点介绍了其中对中文自动校对有参考价值的几种基于特征的方法.

  • 标签: 中文文本自动校对 拼写检查 自然语言处理
  • 简介:摘要本文主要讨论日语自动词可接ヲ格的具体情况及限制条件,收集了248个接ヲ格的自动词,试图用定量的研究方法来把这些可接ヲ格的自动词做一个定性的分析。收集的方法主要通过查阅较有说服力的字典和相关文献资料。

  • 标签:
  • 简介:摘要大气环境与人们的生产生活有着密切的关系。人们要想实现可持续、健康发展目标,需不断提高保护环境意识,加强对大气环境的保护。尤其应将大气环境监测当做重点,以准确、及时掌握大气环境污染状况,并通过分析与研究监测数据,掌握大气环境污染规律,预测未来污染趋势,从而结合实际寻找有效的预防手段,制定针对性预防策略,为人们的发展营造良好的大气环境。

  • 标签: 污染物 检测
  • 简介:摘要本文主要考察日语自动词在接ヲ格的定性分析,很多先行研究都曾指出自动词接ヲ格的特殊情况,把该情况下的自动词定性为表示移动的动词,这多认定为移动表现和空间表现。但是还有很多自动词本身并不具有移动或空间的意味指向。

  • 标签: 日语自动词 ヲ格 移动动词 空间表现
  • 简介:汉语自动分词中的歧义问题侯敏,孙建军引言随着中文信息处理研究的不断深入,出现了多种多样的自动分词方法。评定一种切分方法或一个分词系统的标准不外两条:一是速度,二是精度,而第二条尤为重要。要想提高切分精度,除了要建立一部(或几部)较完备的词典外,最重要...

  • 标签: 汉语自动分词 歧义字段 确定法 歧义切分 歧义现象 句子歧义
  • 简介:语言生态监测与评估是生态语言学的研究领域。建立指标体系,是实现语言生态监测与评估的前提。文章在充分吸收国外有关语言生态要素研究成果的基础上,确立了一套包含人口、地理等12个要素、33个具体指标和指标权重关系建模系统的语言生态监测分级指标体系,以及语言生态质量分级评估标准。语言生态监测与评估指标体系,可以直接用于数据信息平台的建设,运用于我国语言生态监测与评估的具体实践。

  • 标签: 生态语言学 语言生态 监测与评估 指标体系
  • 简介:中文姓名的辨识是自动分词、自动文摘的基础.独立于自动分词,我们运用姓名用字概率和规则,设计并实现了一个中文姓名辨识系统.对207757字语料进行了测试,召回率达到92.57%,精确率达到80.35%,且速度较快.

  • 标签: 概率分布 规则筛选 兼类姓 专有人名 特殊候选姓名对
  • 简介:多义动词的处理是词义自动标注的重点、难点,在组合关系中基于选择限制产生的搭配特征是词义自动标注的主要依据。论文对903个多义动词在真实语境中的分布、组合、搭配进行分析,讨论了多义动词在计算机环境中的识别条件与方法。第一章对选题的基础理论"义项形式论"和核心概念"区别性形式特征"进行了阐释。机器处理语言具有重形式的特点,义项形式特征指义项在具体语境使用中呈现出来的有规律,能够加以归类、概括,并能被计算机识别的标志物(以语义搭配为主),

  • 标签: 选择限制 自动标注 计算机环境 真实语境 组合关系 形式特征
  • 简介:本文结合藏文各类形态特征,首次提出了一种基于格助词和接续特征(BCCF,BasedonCase-auxiliarywordandContinuousFeature)的书面藏文自动分词方案.其总体技术特点是:在格助词、接续特征、字性知识库以及词典支持下,进行逐级定位的确定性分词.初步测试表明:这一方案在发现和消除切分歧义、解决未登录词问题,进而在提高藏文分词精度方面具有很高的实用价值.

  • 标签: 格助词 接续特征 藏文分词