简介:数据挖掘技术能够帮助我们从规模庞大、内容纷繁的文本数据中准确、高效地提炼出研究者难以通过遍览有效捕捉的隐含信息或趋势。其中,词频统计帮助我们获取分析对象的词汇总量、高频词汇以及词汇构成等信息,并据此对文体特征进行较为准确的判断。词表比对揭示了对象文本的叙事方式、所含关键人物、场所和物品等。词语共现网络使我们能够直观地观察到文本中的高频人物、组织等,并揭示这些热词之间的潜在联系,从而快速构建热点事件的基本框架。而通过计算共现强度,我们可以轻松、准确地挖掘出与特定关键词关系密切的共现词,从而有效捕捉与之相关的热点话题和媒体动向。
简介:意象图式是在对事物之间基本关系的认知基础上构成的认知结构。太极图式是在认知语言学中的前景—背景意象图式和凹凸转换原则的基础上,根据华夏先祖的智慧结晶和中国传统文化的象征——太极图所提出的一个能够在认知上运用的意象图式。在太极图式之中,黑色容易成为前景,在认知中占优势,成为注意的焦点,当然注意力集中在白色的时候,白色部分就变成前景,黑色变成背景。之所以不用"罗宾的花瓶"或"凹凸图式"而用"太极图式"对"一个形式可以表示两个完全相反的事件"进行解释,是因为在"罗宾的花瓶"或"凹凸图式"等图式中,前景和背景形状不一样,这样的图式在用对应的语言表达时我们有可能用不同的表达或相反的表达,很难用认为同样的语言表达来描写它们。而使用"太极图式",由于在人们认知上,前景和背景既是相反的、同时形状一样,这样在用对应的语言表达形式时我们就具有了使用相同表达的可能性。日语中的一些语言现象能够很好地用"太极图式"进行解释。