简介:科学研究的第四范式是数据密集型造就的研究范式,它的精髓是在研究中“让数据说话”。在大数据的影响下,人们传统的研究理念和思路会发生变化:从抽样趋向于全样、从关注于因果关系趋向于关心相关关系、从追求精确趋向于获得对发展大趋势的认识。语言研究逃脱不了大数据的“缠绕”。随着数据量的高速增长和计算机算法的发展,计算机依靠语料的大数据将不仅能模拟和仿真,还能进行学习、归纳、分析、推理、总结,并且得到理论;也就是说,过去由索绪尔、乔姆斯基等语言学家从事的工作,部分可以由计算机来做,这开辟了语言科学研究的广阔前景。这样的研究,我们称之为语言的“e-研究”。