这家公司凭什么自信能超越百度做好无人车?

2016年09月27日 07:00 新浪科技 微博
微博 微信 空间 分享 添加喜爱

  新浪科技 郑峻发自美国

  “我们的目标是15个月内,让我们的测试车稳定自动驾驶。“谈起未来的研发规划,自动驾驶创业公司图森互联联合创始人兼CTO侯晓迪对新浪科技如此表示,语气中是满满的自信。

图森互联联合创始人兼CTO侯晓迪图森互联联合创始人兼CTO侯晓迪

  不过,他的自信并不是没有底气。在自动驾驶算法的几项公开排行榜中,图森目前都排在行业首位。KITTI数据集,图森拿到了目标检测三个单项、目标追踪两个单项、道路分割四个单项的总计九项第一;CityScapes数据集,图森在fine和coarse两套评测标准中均位列行业第一。在人脸关键点定位的两个评测数据集300W和AFLW中,图森同样获得了世界第一的成绩。

CityScapes数据集排名CityScapes数据集排名

  参加这些评测的不乏百度、三星、英伟达、斯坦福、中科院、多伦多大学、NEC实验室、加州大学圣迭戈分校等科技巨头和科研机构。值得一提的是,KITTI是德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合创办,是全球最大的自动驾驶场景的计算机视觉算法评测数据集。而大举投资研发无人车的百度,在诸多单项都仅次于图森位列第二。

  然而,与这些声名显赫的科技巨头和研究机构相比,图森互联却是一家创办仅有一年时间的创业公司,无论是资金规模,还是研发人数,都远远无法相比,而投身自动驾驶领域研发更是仅有半年时间。

  侯晓迪两年前毕业于美国最为知名研究机构加州理工学院,拥有计算与神经系统博士学位。2015年8月,他和陈默、郝佳男、王乃岩、黄泽铧等好友创办了图森互联,一开始的研发方向是图片识别和互联网广告,并在随后拿到了新浪5000万人民币的A轮融资。

  在几位联合创始人的分工中,陈默任CEO,负责公司的战略、资金等事务。侯晓迪任CTO,带领位于加州圣迭戈的北美研究院团队,王乃岩任首席科学家,带领国内算法团队,郝佳男任工程VP,带领工程部门。

  虽然凭借着图片识别技术在互联网广告领域取得了不错进展,成为新浪及微博的广告技术提供方,但侯晓迪似乎并不满足于现状。“我们已经开发了一套系统,产品经理只需要动动鼠标就可以完成深度学习。但在这方面未来的想象空间并不大,主要的发展挑战是商务团队的推广。这并不是我们想看到的。我们要做就要做一个三年都做不完的新项目”。侯晓迪对新浪科技表示。

  3月底,侯晓迪基本放下了此前互联网广告方面的工作,彻底转向无人驾驶方面的研发工作。6月底,他们做了一个搭载感知技术(Perception)的原型汽车,通过汽车上安装的摄像头,完成无人驾驶以及辅助驾驶所需要的模块功能。按照图森在3月初的研发规划,他们计划在所有计算机视觉和自动驾驶相关的数据集上都拿到第一。而这个目标在本月已经实现。

  自动驾驶已经成为目前最为热门的科技领域。这个领域既有谷歌、百度、英特尔这样的科技巨头,也有丰田、本田、福特这样的传统车企,更有Mobileye、Cruise(已被福特收购)等大量专业技术提供方。图森进入这个领域,有什么底气?

  侯晓迪向新浪科技解释了自己的看法:百度和谷歌走的是机器人解决方案,主要采用激光测距的Lidar技术,但居高不下的成本是一个巨大的问题。光一个测距仪成本就高达8万美元,超过了大部分汽车的价格。或许未来激光测距仪成本能够降低,那只好也要等待2020年。而他相信图森技术的自动驾驶汽车在2018年就可以上路。

  而图森的自动驾驶解决方案更接近Mobileye,后者也是特斯拉Autopilot技术此前的合作伙伴。Mobileye早在2001年就推出了第一块芯片,也是目前基于计算机视觉的自动驾驶解决方案的主要代表,在很多技术领域占据着领先地位。

  但侯晓迪认为,“深度学习是一个颠覆性的技术,会导致很多产业格局出现巨大变化。也是因为有了深度学习,我们才有底气去和Mobileye竞争。在深度学习时代,很多技术会进行重启。之前积累的很多优势并不能转化为竞争力。”

  那么图森到底会怎样去做自动驾驶?侯晓迪介绍说,“无人车粗分为两个模块,一个是感知,一个是控制。在感知方面,我们打算通过计算机视觉和其他廉价传感器来替代LiDAR。我并不是相信LiDAR会一直这么贵。但是一方面是常年做计算机视觉的信仰,坚信基于视觉的感知还大有潜力可挖;另一方面是在公司整体决策时,不能把全部成败系于“LiDAR”降价这一点上——万一2020年价格还没降下来怎么办?虽然还处于实验阶段,但基于目前的结果,我们已经看到曙光,认为计算机视觉可以解决自动驾驶这个问题。”

  他详细解释说,“我们并不需要在量产车中都安装激光雷达,只需要用SLAM等诸多技术去获得数据,重建外部路况场景,这是非常重要的数据。此外,我们还用到了图像分割技术,这也是一种很好的技术手段,能够极大充实我们的数据库。举例来说,给你一张照片,你就可以把照片上的每个像素都进行分类,知道哪些像素是汽车、自行车、行人、路边、天空。目前我们在这个领域,也是世界最佳水平( CityScapes第一)。我们会用自己的技术,做到分米级精度的高精度地图(远超你手机上Google Map的精度)。”

  谈到硬件设备,侯晓迪表示,图森在摄像头方面肯定会采购市场已有产品,前向两个,左右后视镜会有,车顶上也会有后向的摄像头,目前设计至少应该有5个。“真正量产时的无人车摄像头可能只有硬币大小,你甚至都看不出来。”

  在芯片方面,图森目前的产品会是基于英伟达的解决方案,同时对FGPA等其他候选技术也持开放态度。传感器部分包括摄像头和毫米波,成本可能在两千元人民币左右,计算芯片在18个月之后应该在几百美元的价位,最后的成本会在1000-2000美元,不会超过3000美元。

  上个月,图森与某车厂达成战略合作,基于计算机视觉技术展开自动驾驶研发合作,这是国内首例科技企业、车企、高校联合研发针对重型汽车特别是军用重型汽车自动驾驶技术。图森负责研发基于计算机视觉和深度学习算法,提供自动驾驶解决方案。

  谈到这一合作,侯晓迪表示,“Mobileye 目前有三大优势:一是和很多汽车厂商合作;二是有一个非常大的数据库;三是在汽车控制领域有着很强的积累。这几点都是图森目前的弱项。和该车厂达成合作之后,我们的目的就是让该车厂的汽车自动跑下北京的高速公路。这个合作非常符合我们的长期战略目标,我们的demo车正在测试阶段。”

  不过,除了自动驾驶,图森还有一个目前更为实用的技术——驾驶监控技术。一切的自动驾驶灾难都有一个共同的问题,就是给司机的反应时间太短,小于风险出现的时间。所以,图森自动驾驶产品早期还在车内设置监控司机的摄像头,评估司机可能的反应时间和路面状况,从而在需要时提前警示司机。“举个例子,如果司机一直在聚精会神开车,辅助驾驶产品就不应该每隔几分钟提醒说前方50米有车,请保持车距。反过来,如果司机睡着了,那么即便路面稍微出现一点小状况,我们的系统也会马上唤醒司机。”

  “在确保我们的准确率达到99.99%之前,我们还是处于采集数据的阶段,这套系统一方面是辅助驾驶,另一方面是采集路况的数据,通过分析大量数据来应对各种突发状况。在这个测试阶段,我们一定会时刻观察和警示司机保持专注。”侯晓迪解释说。

推荐阅读
聚焦
关闭评论