周涛大数据 电子科技大学教授周涛谈大数据的变革

2017-06-09
字体:
浏览:
文章简介:    近日,电子科技大学教授周涛博士出席了<2013大数据全球技术峰会>,并提出"大数据的变革"的观点分析.周涛博士作为<大数据时代>这本书的中文译者成为大家

    近日,电子科技大学教授周涛博士出席了《2013大数据全球技术峰会》,并提出“大数据的变革”的观点分析。周涛博士作为《大数据时代》这本书的中文译者成为大家近期关注的焦点。

    周涛博士表示,第一个想跟大家讨论的问题就是什么是大数据。刚才来自不同行业的专家,他们都谈了对大数据的看法,其中强调了很多大数据的特征,比如说数据量特别大,有人讲到处理的速度特别快,恩伟还讲到需要 数据特别精确,但是实际上这些概念固然重要,但也不是大数据真正最核心的概念。

    因为大数据并不是简单的数据量增大了,我们就可以叫它海量数据,它也显然不是一个纯速度的问题。比如说大家用对撞机,或者我 们做等离子试验、或者做气象预报,包括智能交通系统长期的运维预报,它的处理速度只要赶上我们真实的需求就可以了,所以这些都不是真正核心的理念。

首先我第一个想跟大家讨论的问题就是什么是大数据。刚才来自不同行业的专家,他们都谈了对大数据的看法,其中强调了很多大数据的特征,比如说数据量特别大,有人讲到处理的速度特别快,恩伟还讲到需要 数据特别精确,但是实际上这些概念固然重要,但也不是大数据真正最核心的概念。

    因为大数据并不是简单的数据量增大了,我们就可以叫它海量数据,它也显然不是一个纯速度的问题。比如说大家用对撞机,或者我 们做等离子试验、或者做气象预报,包括智能交通系统长期的运维预报,它的处理速度只要赶上我们真实的需求就可以了,所以这些都不是真正核心的理念。

我们自己认为,大数据之所以有这样一个新理念的提出,固然第一是量上的变化,第二是这个数据来源不一样,多元异构,有很多源头都在数据,而且数据有些是结构化的,文本简单的数据,有些是非结构化的语 音视频这样的数据。

    正是在这样共同的力量推动下,形成了大数据可能的一个独特的精髓,就是我们叫做话语关联。我举两个例子,比如我们就一个人,我们知道这个人在短信用户中是一个用户,在淘宝上有一个账号 等等,这一系列的数据根据这个人的本能,加上智能城市中的住址、医保等等数据,在这中间汇集起来,这是一个典型的跨领域不同的数据。

    换一个说法,比如在这个酒店,在这座城市中有对这个酒店的描述,还有一 些车载的GPS,它的轨迹会经过这个酒店,有的人到了这个酒店之后会在微博上签到,同样我们用顺丰可能和这个酒店有货物的来往,这些来自不同的物流、零售、签到的数据,包括空气质量监测的数据,通过同一个位 置有关联性。

    正是由于数据在量上有变化,最终会突破质的飞跃,那就是跨点关联,才会产生以前传统方式不能产生的新的价值。这是回应一下前面几位的观点。