简介:数据挖掘技术能够帮助我们从规模庞大、内容纷繁的文本数据中准确、高效地提炼出研究者难以通过遍览有效捕捉的隐含信息或趋势。其中,词频统计帮助我们获取分析对象的词汇总量、高频词汇以及词汇构成等信息,并据此对文体特征进行较为准确的判断。词表比对揭示了对象文本的叙事方式、所含关键人物、场所和物品等。词语共现网络使我们能够直观地观察到文本中的高频人物、组织等,并揭示这些热词之间的潜在联系,从而快速构建热点事件的基本框架。而通过计算共现强度,我们可以轻松、准确地挖掘出与特定关键词关系密切的共现词,从而有效捕捉与之相关的热点话题和媒体动向。
简介:“V+看+S”存在两种可能的句法结构:连动式和动宾式。连动式“V+看+S”中,“看”为动词,带一个疑问小句宾语S,与前面的动词短语构成连动结构,“看”一般不能省略;动宾式“V+看+S”中,疑问小句S为前面动词的宾语,“看”是在动词和其疑问宾语小句之间起连接作用的标句词,一般可省略。“看”的能否省略与“V+看+S”的句法结构及“看”的语法化有关。间接疑问标句词“看”由动词“看”语法化发展而来,与英语中功能类似的标句词“if/whether”在所引导的小句是否为疑问形式和能否引导主语小句等方面存在明显差异,这与标句词“看”的来源以及汉语的语言个性密切相关。