横扫kitti数据集,图森骨子里都是新浪系的老司机!

2016年09月21日 14:25 新浪综合
微博 微信 空间 分享 添加喜爱

  创业公司图森(TuSimple)通过“霸气外露”的黑科技算法,在全球最权威、最具影响力的自动驾驶算法公开排行榜KITTI和Cityscapes评测数据集上均获得了九个世界第一。

  【听杨姐说】

  这恐怕是人工智能评测平台KITTI和Cityscapes评测数据集上第一次有一家公司“霸榜”,而且还是中国公司。

  9月19日,成立仅仅一年的创业公司图森(TuSimple)宣布,该公司通过“霸气外露”的黑科技算法,在全球最权威、最具影响力的自动驾驶算法公开排行榜KITTI和Cityscapes评测数据集上均获得了世界第一。

  仅KITTI数据集中,图森互联就横扫目标检测三个单项、目标追踪两个单项、道路分割四个单项,共计九个单项的全部世界第一。据悉,参加KITTI和Cityscapes评测的不乏百度、三星研究院、英伟达、UCSD、斯坦福、中科院等名企名校及科研机构。

  (KITTI由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合创办,是目前国际上最大的自动驾驶场景下的计算机视觉算法评测数据集。用于评测目标(机动车、非机动车、行人等)检测、目标跟踪、道路分割等计算机视觉技术在车载环境下的性能。KITTI包含市区、乡村和高速公路等场景采集的真实图像数据,每张图像中多达15辆车和30个行人,还有各种程度的遮挡。)

  不仅如此,这家公司还有另一项更酷的技术,也是现在比较前沿的黑科技:只要一个摄像头,通过先进的算法,所到之处就可以用3D的框自动把行人、车辆、自行车框出来,这样一来,车头所在方向也很容易识别出来。而传统上的目标检测只是通过2D的框来标出周围物体,识别精度远不如3D。

  这家“一不小心”就创造了这么多世界第一的创业公司图森互联,平均年龄仅有28岁、拥有毕业于加州理工学院、卡内基梅隆大学、香港科技大学、南洋理工大学等国内外知名学府的顶尖人才——而其管理团队,其实都是行业里的“老人”,其CEO陈默甚至已经成功“卖”过两家公司!

  酷团队炫技术

  图森公司CEO陈默是个连续创业者,曾经独立创立运营过三家公司,和40多家互联网平台达成战略级合作。2015年陈默结识了一批计算机识别和人工智能领域的技术大牛,有心利用自己积累的资源人脉和运营经验让这些牛叉的技术商业化,因此,当后来新浪的投资负责人刘运利找到他说,想投一个计算机识别和人工智能的团队时,陈默毅然决定再次创业。

  确实,图森互联的核心技术团队堪称“梦幻阵容”。联合创始人侯晓迪是图森的CTO,这位加州理工学院的博士,本身就是计算机视觉和认知科学领域专家,他创立了基于频域的视觉注意机制理论,基于这个理论的论文已经被引用2000多次。

  另外一个技术狂人是公司的首席科学家王乃岩,他是香港科技大学博士,2014 Google PhD Fellow计划的入选者,多次在国际数据挖掘和计算机视觉比赛中名列前茅。

  此外还有另个很有“背景”的人——工程技术VP郝佳男,南洋理工大学博士,他有十年并行和分布式运算研究经验,曾是淡马锡国家实验室研究员。另一位算法科学家黄泽铧则是卡内基梅隆大学机器人学硕士,计算机视觉和人脸分析领域专家,负责图森的驾驶员监控系统研发,此次图森在人脸关键点定位数据集300W和AFLW中也名列第一。

  图森互联成立后,最早瞄准的是图像识别SaaS。这支明星管理团队曾经开发过一套车品牌的识别系统,帮助新浪微博在茫茫“博海”中识别出每一个用户发布的图片是不是汽车,以及是什么品牌的汽车、什么型号的汽车,以便新浪对用户进行精准的汽车营销——新浪的广告30%来自于汽车。

  “那套识别系统主要针对的是UGC的用户,照片不论从车的哪个角度拍摄,都能被准确地识别出来,精准度几乎到达了97%。”

  其实,牛叉的算法在很多领域都可以落地,图像识别是一块,安防和自动驾驶也是。这支明星技术团队和此前的技术积累,给了陈默进军自动驾驶的信心。从今年3月开始转型自动驾驶研发,没半年就鼓捣出来了“九个世界第一”。

  其实,这“九个第一”才是陈默为公司规划的未来,因为他认为人工智能是大势所趋,无人驾驶将会有很大发展。

  “开门造车”

  事实上,从“九个第一”到商业化中间还有一个步骤,就是自己去改造一台车让技术“落地”。

  无人驾驶可以分为两个阵营,一个是Google和百度的以激光雷达为核心,然后配上高精度地图的技术路线,这两家公司历史上积累的数据都是基于机器人、自动化的,此前雷达“玩”得比较熟。现在技术延伸过来就用雷达来做,但这个方向的最终目标是无人驾驶,而不是自动驾驶。不过激光雷达的成本巨高,一套64线激光雷达要8万美元,一台无人驾驶车基本上要装四部,不是一般创业公司能玩得起的。

  另一个阵营就是以特斯拉为代表的,包括奔驰、沃尔沃这些车厂,自己做渐进,从ADAS(高级辅助驾驶)开始做,做前车防碰撞,然后在限定路况做无人驾驶,比如说高速、堵车、自主停车——例如在酒店门口停了车以后,这个车自己会去找车位停好;以及主人从酒店出来后一摁按钮,车自己会过来接主人;还有就是一些限定环境下的无人驾驶。

  这第二种技术路线的成本就没有激光雷达那么高了,用的主要是计算机视觉配合毫米波雷达的方案,成本仅为激光雷达的二十分之一,但是技术难度大:对算法的要求极高。

  陈默的图森采用的正是后者的路线,一个渐进的道路,跟北方奔驰和北理工一起正在合作开发解放军第三代的运输车辆的自动驾驶系统。

  说穿了,就是“应用层”。

  “目前图森是国内唯一一家能在车上跑demo的自动驾驶企业。我们自己改造了一下车,功能已经达到Mobileye EyeQ4,也就是2017年底2018年初要发布的这个芯片所带来这个功能。举个例子,现在大家还只是用2D的框把移动中的人、车框出来,而EyeQ4可以用3D的框把车、人以及可行驶路面都框出来——人坐在车里,让车一边开,3D的框就建好了,哪个是人,哪个是车。”陈默表示,这是国际最前沿的算法。

  注意,这里还需要解释一个概念,就是L1-L4——即自动化驾驶汽车分为 4 个级别,L1 高级辅助驾驶阶段、L2自动辅助驾驶阶段,可实现自适应巡航加上车道保持,典型的例子是特斯拉;L3 特定情况下自动驾驶; L4完全无人驾驶阶段,甚至没有方向盘。

  技术DNA

  图森希望达到的水平是L3,即在特定情况下自动驾驶,例如高速公路上,堵车环境、一个驾驶员开着前面一台车后面的车全是自动驾驶,或者是一个人管一个车队,即后面的车跟着前面的车走,司机只负责注意一些突发情况,还做不到L4点对点的无人驾驶。

  L3是一个在可控时间表内,相对可实现的目标——图森现在合作的全是大型的重卡,特别是大型物流中心对物流中心、点对点高速公路的情况,图森的解决方案能够帮物流公司节省很多成本!

  例如有两种节约办法:1。就是在实现单车的自动驾驶的情况下,省下一个司机的成本,要知道,现在的长途车送货基本都必须两个司机,政府要求每4个小时要换人;2。在road train也就是车队的情况下,追随领头车的其他车辆可实现完全无人驾驶,会省下更多司机的成本。

  想象一下,如果一个运输大队,节省一半司机的人工成本,这对物流公司来讲将是一个多么大的诱惑!

  当然,并没有那么简单,图森的服务还可以蔓延到整个车队的管理系统。

  “我们相信这样的系统可以大幅降低失误率以及人工成本。”陈默说:“首先,这种工作模式特别适合高速环境下,路况比较简单,只有一个上下匝道、进口出口。第二,高速公路上跑的全是车,属于可控的场景,我们只做车、人、机动车和非机动车识别就可以了,不用识别雕像、柱子等等这样的东西,相对来说简单一些。”

  尽管陈默说起来好像很简单,但沃尔沃以及很多公司也还处于开发阶段。

  陈默透露,其实特斯拉是率先把这个技术商业化的,但它的技术并不是最好的,特斯拉的感知模块用的Mobileye,但Mobileye从来没拿这个模块做自动驾驶,它只是做这个高级辅助驾驶。只是特斯拉的胆子大。换句话说,沃尔沃也是在自动驾驶上走得比较靠前的企业,它也具备了这个能力,只是没有商用,因为它觉得还不太保险。而Google做了那么长时间的测试,也还没有上路,其中一个原因是Google的成本太高。

  来源:小白不菜(微信号:xiaobaibucai521)

推荐阅读
聚焦
关闭评论