大数据正在开启一次重大的时代转型。日前,中科院院士郭华东向《中国科学报》记者表示,当前世界各国同处大数据起步阶段,我国应当整合各类资源,加快国家大数据建设进程。
郭华东说,数据是科技领域飞速发展的产物。谷歌每天运算数据是20PB,欧洲核子中心每天产生数据量约16 PB,全球至2030年用于全球变化研究的对地观测大数据约150PB。2014年4月,国际数据公司发布的第七份数字宇宙的研究报告指出,全球数据总量将以每两年翻一番的速度持续增长,2013年到2020年的数据量将增长10倍,从4.42ZB增长到44ZB。2013年,数字宇宙中只有不到20%的数据与云有关,到2020年,这一比例将翻倍到40%。
“截至2012年,全球数据分布比例为美国31%,西欧19%,中国13%,印度4%,其他国家32%。预计到2020年,中国将产生全球21%的数据。”郭华东指出,随着计算机技术和网络技术的快速发展,半结构化、非结构化数据大量涌现,数据的产生已经不受时间和空间的控制。
当前,大数据已经在政府层面得到高度重视。国际组织也在不断推动大数据发展。国际科学理事会颁布的战略规划着重强调了管理数据和信息以及利用科学数据和信息发掘新知识的重要性。 目前,我国的科研机构也在大数据方面加强与国际机构的合作。“此前,7个大型国际组织和中科院遥感地球所联合发布了‘大数据服务国际科学计划声明’,提出了7项建议和4项未来行动纲领。”郭华东介绍,这七项建议是积极响应大数据服务于国际科学计划的重要性;开发利用大数据的优势用于服务社会;通过国际合作提升对大数据的理解和认识;通过全球研究基础设施推动大数据的普及;探索并解决大数据管理的挑战;鼓励能力建设和技能培养;促进政策发展,最大化开发利用大数据。四项未来行动纲领包括建立大数据服务国际科学计划的案例研究;推动跨学科间的大数据应对举措的共享;大数据的研究政策、伦理道德和法律问题;大数据研究管理和可持续性挑战。
“随着科技的不断发展,数据正在以爆炸性的规模增长。我国应当加快国家大数据建设进程,把大数据做大做强,服务国际,引领世界。”郭华东最后表示。