统一大数据标准刻不容缓
去年年底,工信部发布了《大数据产业发展规划(2016-2020年)》。“规划”不仅明确了大数据发展的重点任务和重大工程,还提出了十三五时期大数据发展的多项量化目标,即到2020年,大数据相关产品和服务业务收入突破1万亿元,年均复合增长率保持30%左右;培育10家国际领先的大数据核心龙头企业和500家大数据应用及服务企业;建设10-15个大数据综合试验区,创建一批大数据产业集聚区,形成若干大数据新型工业化产业示范基地,等等。相信在国务院发布《促进大数据发展行动纲要》之后,主管部门发布布局大数据发展的第一个“五年规划”,并提出诸多具体的量化目标,对推动大数据在中国的推广和应用,一定会产生积极的促进作用。
实际上,提出大数据发展的量化目标,一些地区已经走在前面。如早在2013年上半年,重庆市即宣布启动大数据发展战略,2017年预期形成500亿元的市场规模。2016年上半年,北京市提出到2020年,全市大数据产业规模将达千亿元。几年来,大数据交易也愈来愈受到各方面的重视,并被提上日程。北京、上海、河北、浙江、贵阳等多个省市都成立了大数据交易中心或交易所。一些非直辖市、非一线城市对大数据的重视更令人瞩目。如贵阳市连续举办大数据产业峰会;盐城市在过去一年就主办了中国大数据企业大会、合作共建国家级大数据产业基地推介会,并与一批企业签订了入驻协议。而2016年5月,贵阳大数据交易所在其发布的“2016年中国大数据交易产业白皮书”中称,中国大数据产业规模2014年为1038亿元,2015年为1692亿元,预计2016年为2485亿元、2020年将达13626亿元;同时预计2016年国内大数据交易规模为62亿元。
笔者注意到,在以上诸多数据中,涉及大数据价值量的数据已经出现了一些不同的概念表述,如相关产品和服务业务收入、产业规模、市场规模、交易规模等等。而不同数据至少在量级上看似也并不太协调,特别是2016年国内大数据交易规模62亿元,笔者一开始以为看错了或是印错了,但查看了不同来源的版本,从标题到具体段落,千真万确都是62亿元。这是一个什么样的规模呢?2016年春节档影片《美人鱼》,总票房33亿元,2017年春节七天长假,国内院线票房也是33亿元。2016年国内大数据交易规模,尚不及一部《美人鱼》加今年春节七天长假的电影票房。如果数据没有错,那么原因有二,或是口径范围较窄,或是真正进行交易的大数据规模确实极为有限。尽管仅阿里一家2015年的线上交易额就达3万亿元,尽管许多大数据企业实时产生着海量的数据信息,但大数据作为财富而用于交易,或许还刚刚起步,看上去还非常有限。
尽管上述概念和数据的研究和发布者一定是经过了深入研究和论证,但可以肯定的是,第一,尚没有统一的国家标准;第二,没有详细的分类;第三,因为没有具体分类,自然也不会有总目标下的分项预期目标。因此,尽快出台统一的大数据国家标准,对大数据的推广应用、对大数据及相关产业的发展,已经到了刻不容缓的时候。综合现有的研究成果及各方观点包括:大数据——电子化生成的达到一定量级的数据及技术的集成;大数据产业——既包括大数据的创造、生产、提供、交易,也包括生产大数据需要的技术和设施;大数据交易——将大数据作为一种商品,在市场上销售和购买。但要依照国民经济行业分类标准将其明确边界并细分,或是对现行的行业、产品分类标准进行补充完善,都是一项十分艰苦细致的工作。而若干年来,文化产业、体育产业、战略性新兴产业、生产型服务业等等,反映其发展进程,在国家或省一级层面都对政府统计提出过明确要求。因此,当大数据发展的量化目标越来越明确和具体化的时候,反映其目标的实现情况、用数据反映大数据的规模与发展,必然会成为对政府统计的一项新的工作要求。所以,无论是从自身应用大数据考虑,还是从反映大数据发展的要求出发,统一大数据及相关标准,都是摆在政府统计部门(当然还有其他政府主管部门)面前一道刻不容缓的课题。
欢迎加入本站公开兴趣群
软件开发技术群
兴趣范围包括:Java,C/C++,Python,PHP,Ruby,shell等各种语言开发经验交流,各种框架使用,外包项目机会,学习、培训、跳槽等交流
QQ群:26931708
Hadoop源代码研究群
兴趣范围包括:Hadoop源代码解读,改进,优化,分布式系统场景定制,与Hadoop有关的各种开源项目,总之就是玩转Hadoop
QQ群:288410967