学科分类
/ 1
7 个结果
  • 简介:全球有多少种语言,这是一个很难回答的问题。国际语言学界通常根据世界少数民族语文研究院(SIL)出版的Ethnologue提供的信息来确定语言的数量,但该书在收录世界语言资料时缺乏一定的严肃性。主要是由于语言身份的鉴定在国际上缺乏一种学术界比较公认的科学的可以量化的识别方法。文章围绕美国《科学》杂志于2009年讨论中国语言识别问题的文章为引子,讨论了语言身份鉴定过程中存在的一些问题,反驳了该文对中国语言识别工作的一些污蔑不实之词,提出需建立一种互通度与语言结构差异度相结合的语言身份鉴定方法,以引起讨论,求得一种国际语言学界都能够接受的语言身份识别的理论和方法。文章还认为在互通度标准以及技术在实践中还没有能够取得学术界一致认可之前,指派最终的语言代码是不成熟的做法。

  • 标签: 世界语言种类 语言身份鉴定 语言识别 语言与方言界限
  • 简介:英语人名的汉译名(CTEN)识别是未登录词中专有名词识别的重要内容。在英汉平行语料库的加工中,CTEN的识别成绩大大影响了其中汉语文本的分词和词性标注精确率。基于CTEN用字与英语人名字母串的音字匹配思想,本文运用平行处理法,在10万句对的大规模英汉平行语料中作了CTEN识别,精确率为99.46%,召回率为92.88%,F值为96.06%。

  • 标签: 英语入名 汉译名 平行语料 自动识别 中文信息处理
  • 简介:在品牌表意过程中,品牌logo作为品牌视觉识别体系中的最主要要素,构成了视觉渠道表意的有效因子。一般而言,品牌logo可以分为文字标识、图形标识、图形与文字复合标识三类,但这都只是从其表面所呈现出来的特征对品牌logo进行的分类,不能反映logo与商品之间的深层意指关系。根据符号与对象间的任意性与理据性关系,品牌logo的符号类型被分为像似性符号、指示性符号与规约性符号。同时,由于品牌logo具有特殊性,各种符号类型间的界限并不明显,三者经常混合,因此,品牌logo是兼具三种品质的符号。

  • 标签: 符号 品牌1ogo 品牌视觉识别 指称
  • 简介:现代藏语形容词谓语在句法结构形式上较为独特,一类是形容词后附存在动词转化来的谓语词缀,形式是:形容词+(副词+)谓语词缀(+表语气谓语词缀/语气词),一类是形容词词根后附典型的动词体貌一示证标记,形式是:形容词词根+(副词+)体貌一示证标记。在详细描述形容词谓语结构和形式标记基础上,对形容词谓语组块进行识别实验,通过文本与形容词词表、副词词表、谓语词缀表和续连规则表的匹配,基本实现形容词谓语的识别,并对误识现象进行了分析。

  • 标签: 现代藏语 形容词谓词 谓语词缀 自动识别
  • 简介:针对目前汉语中介语偏误人工标注缺乏一致性的问题,本文提出了计算机识别偏误的方法。首先参照《外国人学汉语语法偏误分析》一书中的类别体系,对计算机识别各类语法偏误的可行性进行了理论上的分析;然后基于规则方法,选择“比”字句、“把”字句、“被”字句三种特殊句型作为切入点进行了实验验证。经过面的分析和点的验证,得出结论:在偏误标注方面,计算机能够在一定程度上自动识别一些类型的语法偏误,其目标是辅助人工标注而非完全代替人,能较好地保证标注结果的一致性。

  • 标签: 中介语语料库 偏误 偏误识别 计算机辅助标注
  • 简介:通过对初、中级水平留学生汉语交集型与组合型切分歧义识别实验研究发现:两种类型切分歧义识别的汉语水平和链长主效应都十分显著,初级识别错误率、修改率均高于中级。对于交集型切分歧义而言,链长越长,识别错误率越低;组合型链长1、2识别错误率无显著差异,但链长为3时识别错误率显著提高;链长为1时,初级与中级识别错误率相当,链长为2、3时,初级识别错误率高于中级。文章从两类切分歧义特点、汉语水平与链长、动态语境与修改意识等方面分析了造成这些差异的原因,并提出了相应的教学建议。

  • 标签: 交集型切分歧义 组合型切分歧义 链长 词语识别 动态语境