格灵深瞳何搏飞:人工智能将把人大脑解放出来

2015年01月17日18:26   新浪科技 微博    收藏本文     
格灵深瞳联合创始人CEO何搏飞格灵深瞳联合创始人CEO何搏飞

  新浪科技讯 1月17日消息,在上午的2015年极客公园创新大会中,格灵深瞳联合创始人CEO何搏飞作了题目为《机器视觉会改变什么》的主旨演讲。何搏飞认为,vision主要是指视觉和远见。机器有视觉,会给我们更加互动的世界,更加健康的世界。

  何搏飞表示,2015年是自动驾驶的元年,因为奔驰、宝马、尼桑,几乎所有的车厂都在今年发布了自家自动驾驶汽车的计划。很多车厂宣称在2020年,2020年就是五年以后,他们的自动驾驶汽车就会跑在大街小巷。而这些得以实现要依靠于计算机视觉。

  在何搏飞看来,未来的人工智能将把我们的大脑都彻底解放出来,让人自由自在地做有创造性、有创造力的事情。(尚紫)

  以下为何搏飞演讲全文:

  大家好!我今天跟大家聊聊机器和视觉。

  大家都知道,维珍这个单词,它的第一条解释就是视觉。视觉是什么?视觉是一种感知能力。我们知道,人身上其实一共有5种感知能力:视觉、听觉、嗅觉、味觉,还有触觉。

  刚才余凯博士有讲到,人工智能的本质就是自主学习的能力,我非常赞同,人的大脑之所以这么聪明、这么复杂、这么高级,就是因为人可以自主的学习。而我们自主学习的主要来源,就是这5种感知能力。而大家知道吗?这5种感知能力当中,80%我们的大脑所接受的,都是视觉的信息。

  我在这里可以问大家一个问题,如果我们不得不放弃4种感知能力,只保留1种,你会保留哪1种?我相信在座的很多人答案都会跟我一样,你会保留视觉信息,大家有没有想过为什么。

  我们知道,有这样一个数据,我们的大脑分成两半,左脑和右脑,左脑是理性的,右脑是感性的是有创造力的。另外,我们的大脑有将近1000亿个神经元,当中绝大多数的只做一件事情,就是处理我们的视觉信息。

  大家想一想,当我们希望休息的时候,特别是当我们希望让我们的大脑休息的时候,你会做什么事情?你会闭上眼睛。所以,每天当我们的眼睛睁开的时候,我们就主动或者被动的在接受大量复杂的信息。

  大家知道,我们人类主要是通过学习来成长,智慧也是在这样的过程中提高。那么,分享知识就是非常重要的事情。从几千年前开始我们人类就把文字编辑成书。

  但文字承载的信息量是有限的,我们还希望它更加的丰富多彩。所以到了100多年前有了电话,我们可以远距离的让听到我们的声音,后来我们就了广播,终于几十年前我们有了电视,到了十年前最近这段时间大家知道在网络带宽成为可能的情况下视频网站才成为可能。

  为什么?为什么从文字到声音到视频,一步一步到几千年前到最近几年,才能随时随地的分享动态的画面视频?没有别的原因,就是因为动态的视觉信息,是最丰富,也是最复杂的。

  当我们去讨论人工智能,当我们讨论计算机、机器是否有学习能力的时候,我们首先要问自己一个问题,那就是机器有视觉吗?我必须要这样讲,在今天绝大多数场合下,对我们绝大多数人来说,机器是没有视觉的,机器是瞎子。你们可能会反对我,会说我在用手机拍照,我的电脑上也有摄象头,大街小巷有这么多摄象头,难道它们不都是机器的眼睛吗?难道这不是视觉吗?但是大家想一想,当我们拍了这些照片、视频,最终计算机看懂这些视频、照片了吗?

  我们把它存下来,不管是单反相机、摄像机,拍完以后,最终还是要人处理这些信息。为什么?因为在绝大多数情况下,电脑是无法处理这种复杂信息的。

  但是,今天我也要告诉大家,实际上在很多领域里,机器视觉已经在改变我们的生活。当我说到这儿的时候,可能很多人马上会想到第一件事情,就是微软的体感游戏,当你做各种动作的时候它会理解你的行为,配合多媒体的体验,你会感受到互动和丰富的感受。

  所以,当机器有视觉的时候,首先带给我们的就是一个更加互动的世界。

  在这儿我给大家看一段特别有意思的视频,我的朋友黄沙,就用微软的这个传感器拍了一段动感的视频,我给大家放一下:<播放短片>

  我们知道,好莱坞电影和美剧在制作过程中会有一个绿色的背景,它就是做一件事情,就是把人跟背景区分开,这样后期制作的时候就可以把绿色背景换成任何想出现的场景,但是有了三维计算机视觉,任何在座的每一个人都可以把好莱坞特效师做出更加精彩的动画,这只是个简单的例子。

  当机器有了视觉以后,还会给我们带来一个更加健康的世界。

  再举个例子,在我们做心脏手术的时候有一件特别痛苦的事情,大家知道,人的心脏是唯一不能够被麻醉药麻痹使它静止的器官,只要人活着心脏就会不停的跳动,在跳动的心脏上做手术难度是非常大的。所以,很多时候当要对心脏做手术的时候,医生做的第一件事情就是通过医学的手段让心脏停止跳动,然后用最短的时间做完手术再让心脏重新起搏,但将有30%心脏将会永远不能再跳动起来。但如果有一种技术使医生在跳动的心脏上做手术将会挽救很多人的人。

  大家想一下,人的心脏跳动是非常有规律的,如果手术刀可以跟心脏同频率振动,医生通过摄象头看到的就是相对静止的心脏,那时候动手术就相当于在静止的心脏上做手术。这个画面上,白色的网格就是要做手术的区域,通过计算机深度视觉,已经把它稳定下来了。心脏手术很多人看了可能会不舒服,所以我们做了这样一个演示,医生给葡萄剥皮,这在国外已经应用了,我相信不会很久中国也会应用。

  刚才余凯博士也谈到了自动驾驶汽车,大家想一想,当自动驾驶这一天来临的时候,我们将有一个更加便捷的世界。各位极客可能对刚刚过去的2015CES有更加深刻的印象,除了智能硬件以外,应该说2015年今年是自动驾驶的元年。大家知道,奔驰、宝马、尼桑,几乎所有的车厂都在今年发布了自己自动驾驶汽车的计划,很多车厂宣称在2020年,2020年就是五年以后,他们的自动驾驶汽车就会跑在大街小巷。

  我在这里有个判断,我个人总觉得,自动驾驶汽车,将会是第一个真正被人类大规模使用,并且对人类生活产生颠覆性影响真正意义上的机器人。因为,当汽车可以自动驾驶的时候,它对我们来说才是一个真正智能不需要人为干预的机器人。

  大家可能都看到过左边这辆汽车,它其实就是Google的无人驾驶汽车。Google应该说是到现在为止全世界第一个让自动驾驶汽车在人类的公路上行驶超过100万公里的公司。奔驰、奥迪还都处于实验阶段,我曾经跟Google无人驾驶汽车负责人聊过,当时我开了个玩笑,你们Google自动驾驶汽车业只敢在美国这样的城市测试,敢来北京测吗?他当时告诉我,无人驾驶汽车这件事情要成功,最大的障碍和挑战只有一个,那就是计算机视觉。

  因为大家想一想,控制汽车的方向盘、油门、刹车,这些事情简单的传感技术就可以解决,甚至如果是一个纯电动车的话,可能一个软件就可以解决。告诉汽车,从A到B你的目的地在哪,这件事情GPS就可以解决。但是,面对路上发生的一切,可能很多人也学过,所以大家都知道,特别是现在自动挡的车,要把车开起来非常容易,开车真正难的是如何应对路上各种复杂的状况,而这些需要的就是视觉的感知能力。

  我们想一想,如果没有视觉感知,你如何知道前面有行人在穿越马路,一切一切的要实现,必须要依靠计算机视觉。

  大家可能也知道,格灵深瞳是把计算机视觉技术应用在监控领域的公司,为什么到处有这么多摄象头,连接到监控中心,有很多人盯着它看,为什么还需要计算机视觉,我们需要人工智能做这么多事儿吗?我在这里给大家假象一个场景,如果让你在你自己家里,你在看电视,比如时下特别热门的一部电视剧,在很认真的看,这时又把ipad摆在前面观看意甲联赛,同时你的朋友还在给你发微信,三个屏幕。我跟你打个赌,给你10分钟时间,10分钟以后我随机考你这三个屏幕的内容,我相信在座很少有人跟我赌,为什么?因为三个屏幕展示的东西动态画面的时候,对人来说信息太复杂了。

  但想一想,安保中心监控室面对的是这样一个屏幕,大家想我看了很多美剧、电影,有那么多高级的技术,我可以告诉大家,我曾经参观过拉斯维加斯所有大赌场后台的监控中心,跟中国任何一家普通银行的监控中心没有任何区别,都是这样一个大屏幕,几个人盯着这个屏幕在看。我自己在监控中心呆过可能超过100个小时,我当时去的时候正好是世界杯期间,保安们大多数在玩儿手机、看球赛,但相信我,如果让你们去,这不是职业道德的问题,人类是有极限的,当人盯着这样一个大屏幕,看超过10分钟的时候,说实话你其实跟什么都没看一样。

  所以大家想象一下,现在屏幕上所显示的一共是10个大屏,每个大屏16宫格,也就是160路视频。北京机场就有几万路视频,也就是说,如果把每一路视频放一分钟把这些视频轮一遍,就需要5万个小时。所以,发生事情能看到吗?

  每时每刻,每一路视频我们都把它存下来,最后我们当证据用。是的,但你想一想,这么多路视频无时不刻都在存,全世界每卖出两块视频,其中有一块就是卖给安防监控视频的。当有这样海量数据的时候,人类如何处理?

  所以大家想象一下,如果我们可以把每个摄象头,都换成一个智慧像小机器人一样帮我们盯着,当发生问题的时候就可以第一时间预警。所以,当我们的机器有了视觉的时候,我相信大家都能够看到,我们的世界会变得更好。但是当世界变得更好的时候,我们人会变成怎么样了呢?可能你会说人会变得更高、更快、更强,那是奥林匹克精神,其实在我看来,我个觉得我们人的愿望,其实一开始就跟更高、更快、更强是相反的,我们有时候经常说越是说什么越是代表不具备什么。我自己有个观点,我总觉得,人类从一开始所有技术进步的唯一源动力,就是把自己解放出来,或者说的更直白一点,就是让自己变得更懒。

  我们今天,甚至有很多的服务都可以上门,O2O上门美甲、洗车,所有事情都是把人类解放出来。每次重大的技术革命,比如17世纪的蒸汽机革命,19世纪的电力革命,近代的信息革命。工业革命发生以后,机器可以开始取代人类做一些简单的体力劳动,我们的四肢被解放出来,去到一个地方不再需要走路去,可以坐车去。随着电力革命、信息革命,到今天大脑一部分功能都已经被计算机所替代。比如我们要去做运算的时候,我们可以用计算器,电脑、手机也可以帮助我们记忆、存储。

  但是我觉得,这就是为什么我总觉得,人工智能这件事情一定会实现,因为从潜意识里,人一定会不懈的朝着这个方向努力,因为对人来说,最终最难被解放的两个器官,一个是眼睛、一个是大脑。也曾经有人问我说,大家可能也都知道,马斯特和霍金都对人工智能发表了很多威胁论,人工智能成熟以后是不是有很多人会失业?我对这个问题是这么看的。技术变革的时候,都会迫使们做更有创造力、更高级的事情。

  举个例子,比如说农民工进城,过去做农活这是个相对来说更加简单的体力劳动,而当这样的体力劳动被机械化所替代的时候,我们的农民工来到城里,他们做了泥瓦匠、水电工、月嫂,他们挣的钱比我们很多人都多,而未来人工智能替代人做更多事情的时候,人会逼迫做人只有做的事情,更高级的事情。而人能做什么了?去交流、去分享、去进步,最终去进化。

  所以,人做的所有事情,最终就是想实现一件事情,那就是人工智能,把我们的大脑都彻底解放出来,让人自由自在做有创造性、有创造力的事情。

  今天我们这个论坛的主题叫X论坛,维珍的第二条解释就是远见,也就是在未看见的时候,就能通过想象力似乎能看到未来。今天我希望大家在一起分享,希望大家能够跟我一样,看见未来其实就在我们眼前。

  谢谢大家!

文章关键词: 人工智能自动驾驶何搏飞

分享到:
收藏  |  保存  |  打印  |  关闭

已收藏!

您可通过新浪首页(www.sina.com.cn)顶部 “我的收藏”, 查看所有收藏过的文章。

知道了

0
收藏成功 查看我的收藏
猜你喜欢

看过本文的人还看过