媒体报道

中国是数据大国

2022-02-17 13:02:08 admin

这轮AI浪潮的到来,AI算法的日渐成熟功不可没。得益于全球的开源平台,中国企业能够快速复制其他地方开发的最先进的算法。

然而,中国在基础研究方面落后于美国和英国。一个主要原因是人才短缺。美国超过一半的数据科学家有10多年的工作经验,而在中国,经验不足五年的研究人员高达40%。中国目前拥有不到30个专注于人工智能的大学研究实验室。

此外,中国的AI科学家在计算机视觉和语音识别等领域着力更多,相比其他专门领域不成比例。大学的AI项目也能得益于更高的数学和统计学能力,为在该领域保持全球领先付诸努力。此外也可以考虑改变提供科研经费的模式,以促进更多的创新。


图片


这轮AI浪潮,算法的日渐成熟功不可能,但是现在大家把注意力过多地放在算法上,其实是有偏颇的。向阳表示,人工智能产业的发展离不开海量数据的支撑,数据训练量的大小影响着算法实现的成熟度。有人说,AI这个小孩的成长离不开数据这个养料的喂养,之所以在这个时间节点能够“疯长”起来很关键的原因是有足够丰富的数据。

阿里云iDST总监初敏表示,算法、数据、计算平台、用户、商业模式,用互联网的思维把这五个因素串起来,AI迭代才能非常快。以更快的速度使用反馈数据来更新模型,形成这样的正循环周期后,效果就会越来越好。哪怕就是算法不变,只要能不断的反馈数据并不断优化,过一两个月之后,它的能力也会好很多。

为什么全球的互联网巨头在这一轮AI浪潮中能够独领风骚,与其拥有大量的互联网数据有直接关联,在中国拥有最多互联网数据的也是BAT。而事实上传统的IT企业之所以纷纷与互联网巨头达成这样或那样的合作关系,目的也非常清晰,就想得到对方大量的用户数据。


1


2015年IBM收购了Weather Company,因为这家公司拥有大量的天气数据。2016年, IBM收购医疗数据与分析服务提供商Truven Health Analytics。这是IBM公司在一年内进行的第四起与医疗数据相关的重大交易。

2


今年3月13日英特尔以153亿美元巨款收购以色列自动驾驶公司Mobileye。资料显示,Mobileye曾经是特斯拉Autopilot半自动驾驶系统的提供商,是27家汽车制造商的碰撞预测系统的供应商,占目前整个市场份额的70%左右。关于这桩收购,英特尔首席执行官科在奇在写给公司员工的内部信中解释道:“你们中很多人都会心生疑问,为什么我们认为自动驾驶对英特尔的未来如此重要?答案是数据。我们的战略是让英特尔成为每一种技术、每一个行业数据革命的驱动力量。我们是一家数据公司。我们聚焦的业务、我们解决方案的提供方向,都在于创造、使用和分析海量的数据。”


3


中国公司的数据意识的觉醒并非今天才开始。从2015年开始,全国政协委员神州控股董事局主席郭为的提案就一直与数据开放共享有关。今年郭为的政协提案有四项,包括:医疗大数据、智能制造、数据的公共化与市场化、农业信息化,同时兼顾大数据的开放共享、创新应用、机制保障。

另一家同样意识到必须从做IT基础设施浮游到数据层才能获得更大价值的中国IT企业是曙光公司,两年前它就开始打出了“数据中国”旗号,联合众多企业成立了航天星图、中科三清、曙光易通,锁定数据。航天星图专注于地理空间大数据处理、可视化应用,中科三清由曙光与中科院物理所合资专注于大气、水以及土壤污染的预报、预警,治理评估和应急提供可行性的解决方案。曙光易通在静脉识别技术的基础上,自主研制开发出了知能易通指静脉采集验证系统。



图片


除了传统IT企业在抢数据资源,事实上中国也涌现了很多运营和经营数据的公司,比如数据堂、星图数据、百分点等,并涌现了更多公共数据开放平台,比如今年以来,贵州省公安、交通、等部门都在开展数据共享交换,特别是工商与国税、地税部门已经在共享交换平台上实现了“五证合一”“一照一码”的业务办理。

数据显示, 2015年中国数据总量占全球数据总量的13%,据预测,到2020年中国的数据总量将占全球数据总量的比例达到20%,届时中国将成为世界第一数据资源大国和全球的数据中心。

虽然中国将是世界上数据总量最大的国家,但是目前中国的数据开放和数据交易还远远没有起来,中国要想加快AI的应用,必须要更大力度,更大范围地构建开放数据生态,让AI有更多的数据“饲料”。

创新工场发布的《投资AI生态,共赢智慧未来》创新工场人工智能战略白皮书显示,数据隐私、数据安全对人工智能技术建立跨行业、跨领域的大数据模型提出了政策、法规与监管方面的要求。各垂直领域的从业者从商业利益出发,也为数据的共享和流转限定了基本的规则和边界。此外,许多传统行业的数据积累在规范程度和流转效率上还远未达到可充分发挥人工智能技术潜能的程度。



首页盛煌
赢咖5
联系主管