简介:“多”在数量结构中的分布和语义解释受到量词、数词、名词的性质以及“多”字结构所在的句法环境的影响.文章引入测量的视角,对这一系列看似错综复杂的现象做出统一的解释.文章提出,“多”的使用条件具有双重性:1)只有具有内部结构性,即能够被“部分-整体”关系所定义的属性,才能成为“多”的语义作用对象;2)“多”不但要求其语义作用对象满足“部分-整体”关系的定义,并且测量所得到的结果也必须维持相应的“部分-整体”关系.这一单调性限制不但为深刻说明“多”的分布和语义解释规律提供了新的视角,还为汉语中可数与不可数名词、类别量词与其他量词等的分立提供了语义理据.
简介:数据挖掘技术能够帮助我们从规模庞大、内容纷繁的文本数据中准确、高效地提炼出研究者难以通过遍览有效捕捉的隐含信息或趋势。其中,词频统计帮助我们获取分析对象的词汇总量、高频词汇以及词汇构成等信息,并据此对文体特征进行较为准确的判断。词表比对揭示了对象文本的叙事方式、所含关键人物、场所和物品等。词语共现网络使我们能够直观地观察到文本中的高频人物、组织等,并揭示这些热词之间的潜在联系,从而快速构建热点事件的基本框架。而通过计算共现强度,我们可以轻松、准确地挖掘出与特定关键词关系密切的共现词,从而有效捕捉与之相关的热点话题和媒体动向。