学科分类
/ 3
56 个结果
  • 简介:全球有多少种语言,这是一个很难回答的问题。国际语言学界通常根据世界少数民族语文研究院(SIL)出版的Ethnologue提供的信息来确定语言的数量,但该书在收录世界语言资料时缺乏一定的严肃性。主要是由于语言身份的鉴定在国际上缺乏一种学术界比较公认的科学的可以量化的识别方法。文章围绕美国《科学》杂志于2009年讨论中国语言识别问题的文章为引子,讨论了语言身份鉴定过程中存在的一些问题,反驳了该文对中国语言识别工作的一些污蔑不实之词,提出需建立一种互通度与语言结构差异度相结合的语言身份鉴定方法,以引起讨论,求得一种国际语言学界都能够接受的语言身份识别的理论和方法。文章还认为在互通度标准以及技术在实践中还没有能够取得学术界一致认可之前,指派最终的语言代码是不成熟的做法。

  • 标签: 世界语言种类 语言身份鉴定 语言识别 语言与方言界限
  • 简介:英语人名的汉译名(CTEN)识别是未登录词中专有名词识别的重要内容。在英汉平行语料库的加工中,CTEN的识别成绩大大影响了其中汉语文本的分词和词性标注精确率。基于CTEN用字与英语人名字母串的音字匹配思想,本文运用平行处理法,在10万句对的大规模英汉平行语料中作了CTEN识别,精确率为99.46%,召回率为92.88%,F值为96.06%。

  • 标签: 英语入名 汉译名 平行语料 自动识别 中文信息处理
  • 简介:在品牌表意过程中,品牌logo作为品牌视觉识别体系中的最主要要素,构成了视觉渠道表意的有效因子。一般而言,品牌logo可以分为文字标识、图形标识、图形与文字复合标识三类,但这都只是从其表面所呈现出来的特征对品牌logo进行的分类,不能反映logo与商品之间的深层意指关系。根据符号与对象间的任意性与理据性关系,品牌logo的符号类型被分为像似性符号、指示性符号与规约性符号。同时,由于品牌logo具有特殊性,各种符号类型间的界限并不明显,三者经常混合,因此,品牌logo是兼具三种品质的符号。

  • 标签: 符号 品牌1ogo 品牌视觉识别 指称
  • 简介:现代藏语形容词谓语在句法结构形式上较为独特,一类是形容词后附存在动词转化来的谓语词缀,形式是:形容词+(副词+)谓语词缀(+表语气谓语词缀/语气词),一类是形容词词根后附典型的动词体貌一示证标记,形式是:形容词词根+(副词+)体貌一示证标记。在详细描述形容词谓语结构和形式标记基础上,对形容词谓语组块进行识别实验,通过文本与形容词词表、副词词表、谓语词缀表和续连规则表的匹配,基本实现形容词谓语的识别,并对误识现象进行了分析。

  • 标签: 现代藏语 形容词谓词 谓语词缀 自动识别
  • 简介:针对目前汉语中介语偏误人工标注缺乏一致性的问题,本文提出了计算机识别偏误的方法。首先参照《外国人学汉语语法偏误分析》一书中的类别体系,对计算机识别各类语法偏误的可行性进行了理论上的分析;然后基于规则方法,选择“比”字句、“把”字句、“被”字句三种特殊句型作为切入点进行了实验验证。经过面的分析和点的验证,得出结论:在偏误标注方面,计算机能够在一定程度上自动识别一些类型的语法偏误,其目标是辅助人工标注而非完全代替人,能较好地保证标注结果的一致性。

  • 标签: 中介语语料库 偏误 偏误识别 计算机辅助标注
  • 简介:通过对初、中级水平留学生汉语交集型与组合型切分歧义识别实验研究发现:两种类型切分歧义识别的汉语水平和链长主效应都十分显著,初级识别错误率、修改率均高于中级。对于交集型切分歧义而言,链长越长,识别错误率越低;组合型链长1、2识别错误率无显著差异,但链长为3时识别错误率显著提高;链长为1时,初级与中级识别错误率相当,链长为2、3时,初级识别错误率高于中级。文章从两类切分歧义特点、汉语水平与链长、动态语境与修改意识等方面分析了造成这些差异的原因,并提出了相应的教学建议。

  • 标签: 交集型切分歧义 组合型切分歧义 链长 词语识别 动态语境
  • 简介:本文详细介绍了中文文本自动校对的研究现状,包括文本中错误的分类,中文自动校对中常用的语言模型,以及一些有代表性的工作.作为参考,本文还介绍了英文拼写检查的方法,比较了中英文自动校对的异同并重点介绍了其中对中文自动校对有参考价值的几种基于特征的方法.

  • 标签: 中文文本自动校对 拼写检查 自然语言处理
  • 简介:摘要本文主要讨论日语自动词可接ヲ格的具体情况及限制条件,收集了248个接ヲ格的自动词,试图用定量的研究方法来把这些可接ヲ格的自动词做一个定性的分析。收集的方法主要通过查阅较有说服力的字典和相关文献资料。

  • 标签:
  • 简介:摘要本文主要考察日语自动词在接ヲ格的定性分析,很多先行研究都曾指出自动词接ヲ格的特殊情况,把该情况下的自动词定性为表示移动的动词,这多认定为移动表现和空间表现。但是还有很多自动词本身并不具有移动或空间的意味指向。

  • 标签: 日语自动词 ヲ格 移动动词 空间表现
  • 简介:汉语自动分词中的歧义问题侯敏,孙建军引言随着中文信息处理研究的不断深入,出现了多种多样的自动分词方法。评定一种切分方法或一个分词系统的标准不外两条:一是速度,二是精度,而第二条尤为重要。要想提高切分精度,除了要建立一部(或几部)较完备的词典外,最重要...

  • 标签: 汉语自动分词 歧义字段 确定法 歧义切分 歧义现象 句子歧义
  • 简介:翻译符号学作为一种特别的符号,其隶属的系统自然与其他符号学所讨论的存在差异,但学界目前对此涉猎甚少。有鉴于此,本文从符号学系统的一般观念人手,阐明了翻译符号系统的跨语际一文化特征,进而分析了该系统特征形成的各种原因以及对目标语符号系统的积极作用。

  • 标签: 翻译符号 系统 跨语际特征
  • 简介:语音相似程度可以从一个方面反映有共同来源关系的语言系统间的共时亲疏关系。本文在先前研究的基础上,进一步讨论了语音间相似程度的计算办法和语音系统间相似程度的计算办法,给出了通过电脑计算得到的湘粤桂20个相关方言点的语音系统相似程度值,并分析了这些方言间的语音系统共时的亲疏关系。

  • 标签: 语音系统 相似 方言 关系 计算
  • 简介:中文姓名的辨识是自动分词、自动文摘的基础.独立于自动分词,我们运用姓名用字概率和规则,设计并实现了一个中文姓名辨识系统.对207757字语料进行了测试,召回率达到92.57%,精确率达到80.35%,且速度较快.

  • 标签: 概率分布 规则筛选 兼类姓 专有人名 特殊候选姓名对
  • 简介:黔东苗语指示词分为定指指示词和疑问指示词。定指指示词分“近指”noη^3(这)、“对指”nen^3(那)、“中指”moη^3(那)、“远指”ε^1(那)和“非呈现指”i^3(那);疑问指示词只有一个tei^6(哪,何)。

  • 标签: 黔东苗语 指示词 分类
  • 简介:语言是交际的工具,语言交际从功能上可分为传知性交际和寒暄性交际等。前贤对传知性交际及其载体研究得较多,对寒暄性交际的研究不够多,对现代汉语寒暄的研究也未形成体系,其定义与性质、其形式和功能、其理论和应用都有待进一步廓清和深入。

  • 标签: 现代汉语 系统研究 语言交际 知性 功能
  • 简介:<正>一傣语是一种孤立型语言。孤立语里面的一整套表示动词情态的虚词和屈折语或粘着语里面动词的一整套形态变化,既有相同之点,又有相异之点。相同之点是:都是在动词进入句子时必须(或经常)要出现的。部赋予动词以时间的界限,起、止、断、续的情态,表示动作发自主方、对方、客方的某一方,或决定动词是否带上某种主观意志的色彩。用语法术语说就是使动词带上时(时间)、体(情貌)、态(语态)、式(语气)等等语法意义。

  • 标签: 语气词 存在动词 语法意义 傣语 语法作用 动作
  • 简介:从原始台语中分化出来后,布依语第三土语中的元音系统发生了一系列的音变。一是在第一、二土语中常见的6元音系统中增加了低后不圆唇元音,使元音声学空间结构由三个顶点元音决定的三角形变成了四个顶点元音构成的四边形。二是音系成员间发生了分化、合并、转移等链式音变:高元音i、u分别被非周边元音ie、单元音化并高化后推挤出位,被迫裂化为双元音,下移到非周边区域;处于音系空间较低位置的ai、au分别单元音化后高化到中元音e、o的位置,两个中元音被迫双元音化并向非周边元音区域转移。向央元音位置移动后再前化与e合并。后低元音由a单元音化而来。周边元音和非周边元音在周边区域和非周边区域紧密互动中完成了这个推链式的音变。链式音变的动因是第三土语中元音长短对立特征的消失,通过音变后达成了新的对立。链式音变后,第三土语中音系格局的元音系统取得了暂时的动态平衡。

  • 标签: 布依语 元音 链式音变
  • 简介:<正>本文是佤语方言研究的第二篇。第一篇题为《从现代佤语的方音对应看古代佤语的辅音系统》,载于《语言研究》1983年第1期(总第4期)。两篇文章各有主题,又互相联系,互相补充。佤语三个方言的语音系统有什么样的异同,怎样从一个统一的古代佤语演变为现代的三个方言,方音的历史演变又应该构拟出什么样的古代佤语语音系统。我们写这个姐妹篇,就是为了回答这些问题。

  • 标签: 方言演变 辅音系统 紧元音 单元音 元音系统 古代
  • 简介:<正>宋代汉语的韵母系统,到底是一个什么样的情形,我们要研究普通话语音的历史,是必须把它研究清楚的。传统上研究宋代语音,常常以《广韵》或《集韵》等韵书作为主要的依据,特别是以《广韵》为依据。我们认为,《广韵》一书有"存古"的性质,它所分的二百零六韵,包含有古音成分和方音成分,并不能代表宋代实际的语音系统。因此,要探求宋代的韵类系统,不能专主《广韵》。当然,《广韵》应该是研究宋代韵类系统的一种重要材料,不能完全把它撇在一边,但不能作为唯一的依据。要研究宋代的韵类系统,对那些比较能反映实际语音的韵书、韵图,如金韩道昭的《五音集韵》和宋人所作的《四声等子》、《切韵指掌图》以及祝泌的《皇极经世解起数诀》等,决不能够轻视。必须充分利用这些材料所反映的

  • 标签: 韵字 广韵 宋代语音 指掌图 切韵 韵母