简介:数据挖掘技术能够帮助我们从规模庞大、内容纷繁的文本数据中准确、高效地提炼出研究者难以通过遍览有效捕捉的隐含信息或趋势。其中,词频统计帮助我们获取分析对象的词汇总量、高频词汇以及词汇构成等信息,并据此对文体特征进行较为准确的判断。词表比对揭示了对象文本的叙事方式、所含关键人物、场所和物品等。词语共现网络使我们能够直观地观察到文本中的高频人物、组织等,并揭示这些热词之间的潜在联系,从而快速构建热点事件的基本框架。而通过计算共现强度,我们可以轻松、准确地挖掘出与特定关键词关系密切的共现词,从而有效捕捉与之相关的热点话题和媒体动向。
简介:词汇教学是语料库资源和研究手段应用于外语教学时间最早和成果最多的一个领域。国内学者对语料库应用于外语教学,主要是英语教学进行了深入细致的研究。然而迄今为止,俄语语料库在国内高校俄语专业教育中的应用并不普遍,甚至"几乎空白",这对功能强大的语料库而言无疑是极大的资源浪费。本文采用语料库方法,通过调查同义词在不同语体中的分布,发现同义词在不同语体中的优先用词原则,运用语义韵律方法,从新的维度反映词语的搭配特征,揭示其不同的类联接。基于语料库的词汇教学,注重量化分析,能揭示一些单纯靠直觉分析不能发现的规律,为大数据时代的大学俄语教学提供新的视角,促进俄语教学。