大数据与产业创新
朱扬勇 复旦大学计算机科学技术学院学术委员会主任、上海市数据科学重点实验室主任
一、上海的相关基础和条件
在各方面的关注和支持下,上海市数据科学重点实验室已于2014 年4 月在复旦大学挂牌成立。作为一个开放性的实验平台,其相关资源是向各方科学家开放的。它不仅属于上海市的,未来将向全国、全球的开放,这也为上海大数据产业实现开放创新发展奠定了基础、创造了条件。
二、大数据,信息化时代的产物
信息化促进人类社会的进步和发展。信息化战略已实施20 年了,我们今天已充分享受到信息化带来的便利,表现在人们的工作、生活、学习和娱乐等方面,都发生了巨大变化。在这过程中产生了一个副产品,我们说数据只是在信息化过程中的一个副产品。信息化不是为了生产数据的,是为了给我们生活带来便利的。而这个副产品越来越大,就是所谓的数据资源。
随着人们实践的深入,数据的资源战略性开始逐步得到了重视,由十四届五中全会提出信息化战略发展到十八届五中全会提出大数据战略,在国家和本市层面先后出台一系列政策和现代计划。我们应该看到:实施信息化战略,其实际效果是生成数据。而大数据本身不生产数据,是开发利用数据,这是与信息化的最大不同点。
用数据解决问题,解决数据的问题。今天各行各业的人都可以用数据去解决任何问题,解决自身问题是IT 人员需要做的。大数据“大”是一个核心,数据不大不叫大数据,好在数据在这些年内以一个很快的速度增长。
“大”是大数据的好:用数据解决问题,是有针可捞;解决数据的问题,有事可做。同时,“大”是大数据的坏:用数据解决问题,是大海捞针;解决数据的问题,涉及大数据的运算、存储、寻找、搬运等一系列问题,有待于我们从事IT 的科学家、技术人员去解决。
三、数据产业的形成与发展
所谓数据产业,就是对数据资源开发利用所形成的产业。其具有第一产业的资源性,是数据资源的开发、采集与应用;具有第二产业的加工性,数据经过加工形成产品再销售;具有第三产业的服务性,所以我们讲数据产业又是一个服务性产业。那到底是第几产业呢?如果是一二三加起来的就成为第六产业。
这一点特别契合“四新经济”的提法,大数据是一个新技术,对应的是一个新产业,带来的是新的业态,我们讲还有新的模式。结合上海建设“四个中心”要求,特别是金融中心,如互联网金融,非常需要大数据支撑,上海建设一个大数据资源中心非常必要。在其他的行业方面,IT 历来叫革别人的命,不革自己的命。但今天不一样,我们已经看到微软、IBM 曾经的IT 巨头开始没落,基于数据资源的企业兴起,这时候IT 要开始革自己的命了。
大数据带来各种新变化,事例很多。在广告业,大数据真正颠覆了传统广告的做法。还有涉及制造业的,如小米会在终端设备上加载很多的应用,再以低于成本价把设备卖给消费者。而京东烧了25 亿美金,我们消费者得到了很多好处。他们为什么要这么做呢?只为一件事情,搜集数据资源。他们有了数据以后,开发这些数据的资源去卖钱。所以羊毛出在狗身上,找个猪来买单,让我们享受低价。这个业态叫做基于大数据的产业整合。还有如出租车市场、家庭装修市场等,也是颠覆性的。
所有这些做法是以非常低的价格去买到了你的数据,接下来他们数据量不断增加,最终这些大量数据是可以卖钱。以此可引入“数据财政”这个概念。大家知道:土地资源是传统要素资源,在利用开发方面存在传统资源稀缺性与不可重复性等特点,而数据资源则突破了传统要素资源的一些局限,能够多次重复使用,不会因使用而减少,也不会因不用而增值。未来大数据发展可把“土地财政”变为“数据财政”,能够有效利用与开发数据资源,改变当前数据拥有方不愿开放、不敢开放和不会开放的不良局面。
四、数据的开放与开发
我们当前面临的问题:因不清楚开放以后有什么好处,而不愿意开放;因数据开放出来害怕泄密,而不敢开放;因访问人多了网络可能会崩塌,而不会开放。国务院通过《关于促进大数据发展的行动纲要》明确指出,政府要带头开放共享资源数据,做到“开放、共享、安全”六个字。所以,建议政府要像开发土地那样,建立未来数据储备中心,存储可供开发的数据资源。数据要经过整理归整以后才能开发,我们要培养大数据领域的人才,发展数据科技,建立数据资源开发和数据财政全套体系。所以要尽早、尽快、尽量使用数据资源,而不是囤积待涨。
未来数据产业前景引发人们的无限想象,传统依河流而生的流域文明将演化成依网络而建的“网域文明”,网络是人类进步的必须,是绿色文明。当今世界,数据是网络空间的唯一存在,随着信息网络机构的不断涌现,以人际社会网络、物理空间网络和信息空间网络为基础的三个维度将构筑全新的“网络星球”。
大数据产业作为其当前的表现形式,而未来20 年数据开发,发展前景看好、潜力巨大。探索数据世界、发展数据产业是我们的追求。