简介:数据挖掘技术能够帮助我们从规模庞大、内容纷繁的文本数据中准确、高效地提炼出研究者难以通过遍览有效捕捉的隐含信息或趋势。其中,词频统计帮助我们获取分析对象的词汇总量、高频词汇以及词汇构成等信息,并据此对文体特征进行较为准确的判断。词表比对揭示了对象文本的叙事方式、所含关键人物、场所和物品等。词语共现网络使我们能够直观地观察到文本中的高频人物、组织等,并揭示这些热词之间的潜在联系,从而快速构建热点事件的基本框架。而通过计算共现强度,我们可以轻松、准确地挖掘出与特定关键词关系密切的共现词,从而有效捕捉与之相关的热点话题和媒体动向。
简介:一、关于动词型名词词组日本语言学家铃木康之指出,日语的名词词组当中有一部分词组的构成形式和语义结构类型与动词词组有着渊源关系。这类词组的特点是,中心语是典型的动词性名词,而修饰语在语义上则往往表现为中心语动词性名词所表示的动作行为或神情状态的主体、对象、原因、目的、思想内容乃至移动行为的方向或经过的地点等等。例如:“稻妻”“父亲运耘”“牛肉试食”“子供世话”“隐居机嫌取”“旅疲”“无职业苦痛”“帰省荷造”“退校决心”“许可约束”“观音样参”“廊下行来”等。并且,作为中心语的动词性名词对修饰语名词有着执着的同现要求。否则,该名词就难以独立使用。