简介:《中国科学报》2015年1月20日刊登记者肖洁的报道指出,中国工程院院士陈鲸近日表示,"未来的信息世界是‘三分技术,七分数据’,得数据者得天下。"虽然大数据的前景灿烂,但在陈鲸看来,其面临的挑战也非常复杂和艰巨。首先是数据的异构性和不完备性。据不完全统计,目前采集的数据85%以上是非结构化和半结构化数据,因此不能用已有的简单数据结构来描述。而传统关系数据库又无法高效处理这些复杂数据结构表示的数据。数据的不完备性主要是指所获取的大数据常常包含一些不完整信息和错误数据。其次是大数据处理的时效性。陈鲸表示,一般数据样本量越