都说数据价值高,这些免费数据为何没人用

1 月20 日,杭州余杭区社会治理综合服务中心,工作人员在关注舒心就医大数据,了解实时就医动态、预约就诊趋势等信息 黄宗治摄/本刊
➤据美国未来市场研究机构(MRFR)分析,我国在全球开源网络数据应用市场仅占比9%,远落后于美英等国
➤对开源网络数据认识滞后是应用不足的首要原因
文 | 黄劲
数据是信息的基础元素,也是智能技术的基本前提,对数据价值的充分发掘和应用是实现数联、物联、智联的基础,是信息化和智能化得以实现的必由之路。
伴随计算机和互联网技术的暴发式发展,大数据的概念已被普遍接受,然而大数据绝不仅仅限于人们已经掌控在手的各类数据,还有一类随时随地发生、无规则散布于网络空间并无限增长的数据——开源网络数据。
所谓开源网络数据即在互联网上公开可获得的数据,包括各级政府部门的开放数据,企业、社团等组织机构的公开数据,媒体资讯平台的新闻资讯数据,社交网络数据及网民个人的注册、浏览、发布数据等公众可在互联网中重复获取并再利用的数据,体量巨大、更新迅速、结构复杂,同时具备时效性强、直接性高、价值密度低、来源可溯等特点。
开源网络数据是大数据的主体,相比公权机构数据和企业持有数据,开源网络数据公开可得、使用合法、价值多元,在经济发展、社会治理、国防安全、国际关系领域蕴藏巨大的应用潜能,是综合国力竞争的重要课题。
开源网络数据应用潜能巨大
开源网络数据是物理世界在网络空间的客观映射,数据过载、碎片化分布、格式不一、重复传播、真假难辨、掺杂主观意愿、未被索引等问题,导致开源网络数据价值密度低,应用难度加大,需要结合人才与技术优势,在思维和经验的引导下,在方法和技巧的支撑下,经历去粗取精、去伪存真、由此及彼、由表及里的过程,才能形成数据产品与服务,最终影响实际决策。
开源网络数据的应用是数字经济的重要组成,在金融、商业、工业、农业等各领域具有广泛应用价值。发展数字经济的核心就是发挥数据作为新兴生产要素的价值,开源网络数据是其中不可或缺的重要部分。一方面,开源网络数据的应用创造新需求,催生数据源的发掘和数据的采集、存储、处理、分析、研判、可视化等数据应用服务产业链,通过专业分工最终形成各类数据产品,为经济发展提供新动能;另一方面,开源网络数据广泛应用到经济社会各领域各行业,与各类机构内部数据深度融合,为企业科学决策提供重要参考,促进经济增长和全要素生产率倍增。特别对“走出去”企业实时掌握当地政治、法律、文化及相关具体信息,破解海外项目情报缺失风险有独特优势。
运用大数据提高社会治理的民主化、科学化、整体性及可预见性,开源网络数据的重要作用不可或缺。随着互联网的发展,社会治理模式从线下向线上融合,从单纯的政府监管向更加注重社会协同治理转变。管理方面,政府基于海量开源网络数据进行实时深度挖掘分析,及时发现公共卫生、事故灾害、群体性事件等社会重大事件苗头,实时跟踪监测,做到早发现、早预防、早处置;服务方面,政府运用数据驱动的方式应对和解决社会治理中的复杂问题,突破传统依靠经验决策的路径依赖,形成依靠数据决策的新型社会治理机制。同时,整合来自政府各部门内部数据和开源网络数据,建立社会治理大数据信息库,解决跨部门合作难题,有效降低社会治理成本,提高社会治理效率。
应用不足根在认识滞后
截至2020年6月,我国网民规模已达9.4亿,互联网普及率达到67%,网站数量468万个,丰富的网络数据资源构成了我国推进开源网络数据应用的基础,但实际应用严重不足。
从国际对比来看,据美国未来市场研究机构(MRFR)分析,我国在全球开源网络数据应用市场仅占比9%,远落后于美英等国,尚未形成由开源网络数据供应商、解决方案供应商和各类最终用户构成的开源网络数据应用市场,未形成政府支持、大型企业主导、中小企业迅速增长、最终用户广泛受益的发展态势。
从国内大数据产业来看,我国对大数据的应用仍集中在公权机构数据和企业持有数据,特别是电信运营商数据和大型互联网公司数据,对开源网络数据的研究与应用严重缺乏;从国内开源网络数据应用程度来看,大多还停留在数据爬取、存储检索和提供基础舆情分析的起步阶段,缺乏数据价值深度挖掘,更缺乏对开源网络情报的应用。
对开源网络数据认识滞后是应用不足的首要原因。一是对开源网络数据概念及其在大数据中的主体地位认识不清,将开源网络数据等同于搜索引擎数据,认为大数据就是大量数据,特别是政企机构使用互联网技术积累的统计数据。二是对开源网络数据的使用价值认识不足,认为开源网络数据杂乱无章、真假难辨、“公开了就没价值”,忽略数据间的强大关联价值。三是对开源网络数据的市场价值认识不清,将数据要素市场化等同于简单的数据交易,忽略数据作为生产要素需要经历价值挖掘过程形成产品或服务才能转化为实际生产能力。对开源网络数据的重新认识,不仅应普及广大民众,更是国内大数据行业监管机构和企业的必修课。
完善市场释放红利
开源网络数据的应用价值只能通过市场实现,以应用为目的,根据不同层次分工形成专业从事开源网络数据搜集、处理、分析和应用的企业集群,形成数据应用服务产业链,集中专业技术人才、分析人才和应用人才,引导开源网络情报、数据融合分析、知识图谱、神经网络、深度学习等关键技术研究与创新,是开源网络数据价值挖掘和实际应用的客观需要,也是数字经济发展的必然要求。通过合理的社会分工,打破垄断,公平竞争,利用技术、知识、经验、人才之长,创新数据应用供给,拉动数据应用需求,使大数据产业得以良性健康发展,使数据资源的价值得到更充分更广泛的应用。
释放开源网络数据价值红利,尚需法律、政策、体制、机制等方面的创新。一是建立健全市场体系,规范管理开源网络数据市场,维护市场公平竞争,引导各类数据要素协同向先进生产力集聚;二是破除限制开源网络数据应用的不利条件,加紧完善相关法律法规,厘清开源网络数据应用中的法律边界;三是发展开源网络数据应用产业,培育产业中的标杆企业、领军企业和骨干企业,通过市场手段将数据要素转化为实际生产力;四是加大政府数据开放力度,强化大型互联网企业反垄断,倡导政府数据非歧视性公开和开放授权,鼓励各类企业和社会组织通过市场化方式共享数据资源,拓宽数据获取渠道,提高数据资源利用率;五是发挥政府采购在数据应用服务供给和需求关系中的引领作用,优化政府部门和国企数据应用服务采购的体制机制,激发数据应用创新能力,保障民营企业和创新型企业在数据应用服务市场竞争创新中的平等地位;六是充分利用网络空间新领域、数据要素新思维、网络情报新方法、融合分析新技术、政企合作新模式,推动数据应用健康发展,实现要素配置的效益最大化和效率最优化。□(作者为全国专业标准化技术委员会委员)