【GMIC 2017】吴恩达的离职带热AI话题 张宏江说AI将成为水电煤一样的基础设施

2017年03月24日 07:40 界面新闻
微博 微信 空间 分享 添加喜爱

百度吴恩达的离职让AI成为热点话题,人工智能(AI)在无人驾驶、医疗、金融等领域的应用给未来商业生态带来了无尽遐想。中国在这波AI浪潮中占有什么样的位置?云服务等基础设施在未来AI中将扮演什么样的角色?在国内的AI创业中,AI是噱头概念、还是真实可触的现实?

2017年3月22日,在以色列举办的GMIC全球移动互联网大会上,前金山CEO张宏江博士接受了界面新闻记者专访,阐述了自己对AI的理解。张宏江毕业于丹麦科技大学,获电子工程博士学位,曾是微软亚洲研究院的创始人之一、金山CEO。

张宏江认为,AI的下一步高速发展离不开三个主要条件:数据、更快的硬件和更普遍可用的算法。

随着全球设备、机器和系统的连接,大量的无结构数据被创造出来;神经网络有了更多的数据,就变得更为有效。手机、IoT 、低成本数据存储和处理(云)技术的成熟使得可用数据集的大小、结构都有了极大增长。

例如,特斯拉收集了 780mn 英里的驾驶数据,而且通过他们的互连汽车,每 10 小时就能增加 100 万英里的数据。此外,Jasper 有一个平台,能让多家汽车制造商和电信公司进行机器间的交流,这家公司于今年 2 月份被 Cisco 收购。Verizon 在 8 月份做了类似的投资,宣布收购 Fleetmatics。Fleetmatics 做的是将汽车上的远程传感器通过无线网络连接到云软件。

未来,5G 网络的上线将会加速数据生成与传输的速率。据 IDC 的 Digital Universe Report 显示,年度数据生成预期到 2020 年达到 44zettabytes,表明我们正在见证应用这些技术的使用案例。

与之类似的还有硬件成本的降低。GPU 的再次使用、低成本计算能力的普遍化,特别是通过云服务,以及建立新的神经网络模型,已经极大增加了神经网络产生结果的速度与准确率。

GPU 和并行架构要比传统的基于数据中心架构的 CPU 能更快地训练机器学习系统。通过使用图像芯片,网络能更快的迭代,能在短期内进行更准确的训练。

同时,特制硅的发展,比如微软和百度使用的 FPGA,能够用训练出的深度学习系统做更快的推断。另外,从 1993 年开始超级计算机的原计算能力有了极大发展。在 2016 年,单张英伟达游戏显卡就有了类似于 2002 年之前最强大的超级计算机拥有的计算能力。

在数据和计算能力大幅提升背后,算法是配套设施。

更好的输入(计算和数据)使得更多的研发是面向算法,从而支持深度学习的使用。例如伯克利的 Caffe、谷歌的 TensorFlow 和 Torch 这样的开源框架。比如,刚开源一周年的 TensorFlow,成为了 GitHub 上有最多 forked repositories 的框架。虽然不是所有的人工智能发生于普遍可用的开源框架中,但开源确实在加速发展,而且也有更多先进的工具正在开源。

总结起来,AI兴起背后的本质原因是大量数据的产生:从2013年到2020年,数据将以每年40%的速率增长:传统零售巨头沃尔玛每4小时产生2.5PB级的数据量;推特上每天的推文量在5亿条左右;今日头条每天要完成6BT的请求、完成6.3PB的数据处理量(1PB=1024BT)。

下图展示的是最近几年各个应用软件图片上载的情况:

张宏江认为,中国因为人口众多,在数据来源、AI产业上的能力是不输发达国家的,目前处于各自在发力狂奔的状态。

张宏江目前比较看好的两个国内AI创业项目是Face++和今日头条,代表了两个不同的AI创业方向:Face++是人脸识别技术服务提供商,通过AI训练提高人脸识别的精准度,业务做得较早,建立了行业门槛;今日头条则是从行业本身出发,把新闻推送业务做起来,再把AI放进去改善产品。这是两种完全不同的发展模式。

张宏江博士把AI比喻为像电力系统一样的基础设施,没有电的时候,可能有蒸汽机推动;但电被发明后,就创造出了许多基础性的工作。AI也是一样,现在仍处于AI发展早期,未来许多重复性的简单脑力活动都可以用AI来取代。

比如,一些call center都可以完全用AI来替代;一些专科医生的影像识别,可能也会被AI取代,人需要看很多很多案例,积累丰富的经验才能做出判断,这正是AI擅长的。人本身的价值在于创意。

李开复在最近的微博中将“BAT、Google、Facebook、Microsoft、Amazon”比喻为七大黑洞,并明确指出AI发展最需要的人才、技术、数据被吸进去,却不出来,并呼吁更开放的AI。

张宏江认为,现在的创业公司如果做单纯的AI技术供应商是没有价值的。AI必须与数据结合起来。而BAT这种巨头公司因为业务已经渗透进人们生活的方方面面,更容易获取更多的数据。创业公司需要同行业、具体的应用服务结合在一起。

“纯粹的技术提供商,如果没有数据,你是没有前途的。AI的算法只是让数据变得更有价值。”张宏江说。

推荐阅读
聚焦
关闭评论