2020年中国有望成世界第一数据资源大国

 《小康》 ● 中国小康网   2018-02-07 00:35:00

  据贵州省大数据发展管理局相关负责人介绍,部分政府部门在数据收集的过程中,由于缺乏统一的标准,收集到的数据虽然量大,但质量不高,可利用价值低。据此前媒体报道,长江上游地区一些省份的交通管理部门、运输公司不愿与其他省市共享物流信息,造成联运衔接的信息壁垒,甚至出现了同样1吨货,一百公里公路运费比经济发达地区高60元的现象。

  据了解,截至2016年底,广东省全省87个省直部门有6988类数据资源、62332项信息项,居全国各省(区、市)首位。但各部门提出的共享需求仅3649类,省级编目共享仅477类,数据难以真正发挥利民惠民、支撑政府决策的作用。

  此外,尽管部分数据已接入共享开放平台,但由于不能被机器读取,成为无法释放应有活力的“休眠数据”。《2017中国地方政府数据开放平台报告》显示,截至去年4月,全国19个地方政府数据开放平台的8398个开放数据中仍有约25%的机器可读性较差。

  中国科学院院士、北京大数据研究院院长鄂维南表示, “理论上我国有很多数据,但实际做数据分析会发现利用起来非常困难。”贵阳大数据交易所有关人士透露,不少企业以保护商业机密或节省数据整理成本等为由,不愿意交易自身数据。部分政府部门也缺乏数据公开的动力:有的是因懒政而让数据沉睡,有的则是已经利用数据开展商业化应用,不愿共享。

  其二是技术创新滞后。我国大数据产业虽然与国际大数据发展几近步伐相同,但是仍然存在技术及应用滞后的差距,在新型计算平台、分布式计算架构、大数据处理、分析和呈现方面与国外仍存在较大差距,对开源技术和相关生态系统影响力弱。市场上,由于国内大数据企业技术上的不足,用户更加青睐Google、IBM、Oracle、SAP等国外IT企业。

  微软大中华区董事长兼CEO柯睿杰认为,数据智能并非那么触手可及。大数据来源众多、数量巨大、形式各异,要从中获得一目了然的信息,就需要真正高效、可靠的数据管理和分析平台。

  如何处理巨量数据是中国大数据产业面临的首要技术问题。鄂维南表示,“中国的数据体量特别大,比如,中国的视频比任何国家都要多,这些数据储存困难,需要用的时候往往就没了”。再以基因测序领域为例,中国每年新增的基因组测序原始数据超过20PB(1PB相当于100万GB),面临数据量大、数据处理流程长等技术挑战。

  目前,我国大数据技术创新能力还有待提升。《大数据产业发展规划(2016-2020年)》指出,我国在新型计算平台、分布式计算架构、大数据处理、分析和呈现方面与国外仍存在较大差距,对开源技术和相关生态系统影响力弱。同时,大数据应用水平不高。我国发展大数据具有强劲的应用市场优势,但是目前还存在应用领域不广泛、应用程度不深、认识不到位等问题。

作者:佚名
责任编辑:风华
来源:中国经济网