会议基本情况
2015 年12 月30 日,“金桥产业技术创新会议”第十二次会议在上海科学院举行。本次会议由上海科学院、上海产业技术研究院、上海市中国工程院院士咨询与学术活动中心、上海金桥经济技术开发区管委会共同举办,主题为“应用驱动下的大数据价值挖掘”。英国帝国理工学院终身教授郭毅可博士作了题为“大数据创新——英国帝国理工数据科学研究所和全球数据观察站”的专题报告,上海生物信息学会理事长、上海产业技术研究院生物医学研究院院长李亦学教授作了题为“生物医学大数据与精准医疗”的专题报告,复旦大学计算机科学技术学院学术委员会主任、上海市数据科学重点实验室主任朱扬勇教授作了题为“大数据与产业创新”的专题报告。参会的学术界、产业界和咨询业专家学者,共同探讨在当今信息化时代,如何挖掘数据资产化与规模化带来的潜在价值,利用数据资源发现并把握产业创新机遇,推动上海实现创新驱动、转型发展的战略目标,提出相关建议,并形成专题咨询报告。
一、大数据是多学科交叉的基础和媒介,数据可视化分析有助于推动大数据技术应用创新
大数据的真正目的不是单纯地去研究数据科学,它更多地是一种多学科交叉的技术和媒介。英国帝国理工学院组建了一个跨学科的数据科学研究所,隶属校级垂直管理,以数据科学驱动为特征,做到多学科交叉,组建了数据同化、脑信息学、社会与文化分析等三个实验室,推动大数据与多个学科的融合。虽然医学、粒子物理、管理学、金融等各个研究领域涉及的问题不尽相同,但是所采用的研究方法类似,都是应用数据科学驱动,这是科研范式的扩展与变革。
当前,数据可视化已经做到运用机器学习的方法来研究呼吸道疾病的生物标志物,用数据同化的方法来整合观察数据和生理模型,以及高精度仿真数据的可视化,数据的可视化分析已经成为推动大数据创新的重要工具,能够挖掘出数据背后隐含的重要信息与内容。基于全球现有三个全球数据观察站的布局,建议上海尽快建造全球数据观察(上海)站,运用支持大数据分析的认知模型、大规模高维数据的信息可视化技术、可视化分析的人机交互技术以及基于多屏的超大规模数据可视化技术,通过大数据技术应用创新,让数据与各领域各产业充分融合,挖掘大数据应用价值,以推动经济社会的全面发展。
二、生命科学进入信息时代,我国生物医学大数据建设需要奋起直追
新一代的基因组学技术使得数据翻番的时间缩短为5 个月,生物医学大数据的增长规模超出想象,2015 年,生命科学和医学研究产出的科学数据保守估计将超过EB,当前我国生物医学计算存储能力实际上已远远跟不上数据产生的规模要求。
主要发达国家早期就建了生物医学大数据基础设施。美国的GTL 计划、欧盟2010 年发表的《科学研究设施战略规划报告》(ESFRI)中,均提出要加大生命科学生物信息数据共享基础设施建设,其中欧盟过去五年间的投入高达数亿欧元。国际数据库建设已持续30 年以上,累计直接投入超过百亿美元。
大数据在生物医学发展的竞争主要体现在三个方面:数据资源和计算存储容量、规范的临床数据获取能力、大规模数据分析处理能力。大量的样本资源是我国生物医学方面的主要优势,将优势转化到临床应用需要多年努力。我们应当把握机遇,应按照一定的标准和方向扎扎实实做十年甚至更长时间,将资源优势转化为我们的能力与实力。
三、变“土地财政”为“数据财政”,发展大数据产业,构筑未来“网域文明”与“数据星球”
土地资源是传统要素资源,在利用开发方面存在传统资源稀缺性与不可重复性等特点。数据资源则突破了传统要素资源的一些局限,能够多次重复使用,不会因使用而减少,也不会因不用而增值。当前,国家层面已经变信息化战略为数据战略。2015 年8 月19 号国务院通过了《关于促进大数据发展的行动纲要》,五中全会特别提出把大数据作为国家战略。未来大数据发展可把“土地财政”变为“数据财政”,能够有效利用与开发数据资源,改变当前数据拥有方不愿开放、不敢开放和不会开放的不良局面。
就总体发展态势看,数据资源开发利用已成为一个新兴产业——大数据产业。大数据产业是集第一产业的资源性、第二产业的加工性和第三产业的服务性为一体,其产业形态新颖。大数据产业的本质是基于大数据的产业整合,目前这种整合已渗透到手机、打车、电视、手表等各种终端设备上,“互联网+”已成为产业创新和传统产业转型升级的典型做法。
未来大数据产业前景引发人们的无限想象,传统依河流而生的流域文明将演化成依网络而建的“网域文明”;当今世界,随着信息网络机构的不断涌现,以人际社会网络、物理空间网络和信息空间网络为基础的三个维度将构筑全新的“网络星球”。大数据产业作为其当前的表现形式,发展前景看好、潜力巨大。
四、把握好大数据自身特点,客观看待大数据隐私权等敏感问题
大数据产业发展有其自身规律,既要有明确目标、足够的知识技术储备以及数据资源支撑,又要求从业人员能够勇于试错,善于发现其内在规律与原理,具备对研究领域的敏感性、预测和判断能力,寻求与时俱进的工作方法和运行模式,使大数据市场价值得以实现。
对于大数据的隐私权问题是业界讨论的热点,这既有技术问题,也涉及法律、道德伦理方面问题。当前,对数据管理体系的软件和硬件的安全性尚缺乏基础的评估和严格的规范流程,缺乏对从业人员而言易于操作使用的安全设计指导和相应的技术支撑与服务。事实上,大数据价值就在于应用,这是在交换与交易的过程中实现的,我们不能把数据开放应用与数据安全性对立起来,确保数据安全、保护隐私权是实现数据开放、做好数据交易的前提。保护隐私权也有个尺度把握的问题,将隐私权细化进行权限设计,然后根据权限级别将隐私权做不同定价,或许不失为一种实现双赢、打破困局的新思路。