特斯拉“行为克隆”技术曝光:无需写代码,实现全自动驾驶?
yuyutoo 2024-10-22 18:43 3 浏览 0 评论
【新智元导读】特斯拉最近曝光“行为克隆”技术,系统研究人类在各种场景中的驾驶动作并加以模仿。巧合的是,自动驾驶第一大厂Waymo不久前也在公布了模仿学习中的技术细节。模仿学习会成为全自动驾驶的一条捷径吗?
全自动驾驶的“捷径”来了?
知情人士表示,特斯拉汽车收集了大量的来自摄像头和其他传感器的数据,即使Autopilot系统没有开启,开发团队也可以研究传统的人类在各种场景中的驾驶动作并加以模仿。
这种技术被称为“行为克隆”,实际上是一种模仿学习(imitation learning)。
系统使用模仿的信息作为车辆在特定情况下决定驾驶方式,比如,行驶弯道或避开前方目标等。
无独有偶,为了模仿专家驾驶,自动驾驶大厂Waymo不久前也创建了一个名为ChauffeurNet的深度RNN,该网络通过观察场景的中层表示作为输入,训练它发出驾驶轨迹,最终的结果能超越纯粹的模仿。
此外值得注意的是,上周AlphaStar战胜人类选手之,就涉及到模仿学习。AlphaStar只通过观察人类如何玩游戏,就能模仿学习策略,最后将信息用于训练各种智能体。
现在,自动驾驶界的两只领头羊都在尝试做模仿学习,这会成为全自动驾驶的一条捷径吗?
特斯拉行为克隆:未来人们不需要写代码了
特斯拉的自动驾驶系统Autopilot的核心功能与其他半自动驾驶系统和全自动驾驶系统类似:在Autopilot可以运行之前,特斯拉从汽车的传感器(如前置摄像头)收集数据。
之后公司雇人对图像中的汽车和其他物体进行数字标记,然后将一些图像输入神经网络计算系统,该系统会对其他车辆及其行进方式进行模式识别,并且随着时间的推移提高车速。
通过神经网络提供足够的真人驾驶数据,网络就可以学习如何在大多数情况下直接预测正确的转向、制动和加速行为。
但特斯拉不同的地方在于,“行为克隆”让Autopilot开发团队也可以研究传统的人类驾驶在各种场景中的动作,从而加以模仿。
这样做的结果是,你不需要任何其他东西来教系统如何自主驾驶,在未来,人们不需要编写代码来告诉汽车在遇到特定情况时该怎么做,因为汽车自会知道该怎么做。
这个概念被特斯拉的一些工程师称为“软件2.0”。
深度理解模仿学习:未来或能交叉预测其他智能体的反应
“软件2.0”可能是一种产品概念,“行为克隆”的背后是技(学)术概念——模仿学习。
目前,特斯拉对于模仿学习的详细介绍资料比较少,但是Waymo去年11月发的一篇论文,可以窥见模仿学习的部分技术原理。
Waymo创建的ChauffeurNet的深度递归神经网络(RNN),通过观察场景的中级表示作为输入来训练该网络生成驾驶路线的轨迹。中级表示不直接使用来自传感器的原始数据,从而可以将感知任务分解出来,能够将真实数据和模拟数据相结合,更容易地进行迁移学习。
如下图所示,输入表示包括一个自上而下(鸟瞰)环境视图,其中包括地图、周围物体、交通信号灯状态、车辆过往的运动等信息。该网络还能够给出谷歌地图风格的路线,引导车辆前往目的地。
为驾驶模型渲染输入和输出。上排从左至右:路线图、红绿灯,限速和路线。下排从左至右:当前智能体框、动态框、过往智能体姿势,未来智能体姿势输出。
ChauffeurNet在每次迭代期间会沿着未来的驾驶轨迹输出一个点,同时将预测点写入在下一次迭代期间使用的存储器中。从这个意义上讲,这个RNN并不是传统式的,因为存储模型是定制化的。
接着,ChauffeurNet将由十个未来的点组成的轨迹输出到一个低级控制器,该控制器将这个轨迹转换为对车辆的控制命令,比如转向和加速,来驱动汽车。
此外,Waymo还采用了一个单独的“感知RNN”头,能够迭代式地预测环境中其他移动物体的未来轨迹,并且这个网络与预测车辆驾驶的RNN共享特征。
ChauffeurNet内部分为两个部分,FeatureNet和AgentRNN。 AgentRNN使用过去智能体姿势的渲染图像、由渲染输入的卷积网络“FeatureNet”计算出的一组特征、具有最后一个智能体框渲染的图像,以及具有预测渲染的显式存储器,来预测下一个智能体姿势和自上而下视图中的下一个智能体框。这些预测用于更新AgentRNN的输入,以预测下一个时间步长。
未来的一种可能是,车辆可以在选择自己的驾驶轨迹的同时,更深入地交叉预测其他智能体的反应过程。
模仿学习是“捷径”还是“普通路径”?
“行为克隆”也好,“软件2.0也好”,利用神经网络编写代码来自动驾驶,从而取代人类编写的代码,看上去可能是未来全自动驾驶的捷径之一。
不过,特斯拉“行为克隆”的也有其局限性:这种方法不能教Autopilot系统处理无法轻易预测的危险情景。比如,老司机看到飘在前方的塑料袋时不会转向,但自动驾驶系统可能就会。
这也是自动驾驶存在的识别训练数据相关性问题,它不能通过纯粹观察相关性来构建因果模型,并且无法在模拟中主动测试反事实。
另外,传统方法实现完全自动驾驶系统,需要能够处理现实世界中发生的长尾事件。
长尾事件的解决需要深度学习训练尽可能多的数据,但现实情况往往是缺少有效训练数据。
一位长期从事自动驾驶的业内人士告诉新智元,“行为克隆”是快速收集大量数据的捷径,但网络传输速度和计算量都太大了。“至于是不是实现无人驾驶的捷径,要看能不能搞出真正能用的系统。”
驭势科技CEO吴甘沙告诉新智元,模仿学习的主要局限是数据的可获得性和有效性,比如影子模式可能解决了可获得性,但也包括了不值得提倡的司机行为。另一方面,它还是端到端的,在可解释性上才刚刚有些进展。同时,因为是端到端,比较难在中间过程中接受其他的信息或指令。
吴甘沙认为,模仿学习“肯定是路径之一,或者是决策的一个来源,但目前来看还不能作为唯一决策方法。”
One more thing:特斯拉AI芯片专利曝光
据Hot Hardware报道,特斯拉向美国专利商标局提交的专利中提到,传统处理器可以快速执行单个数学运算,但它有一个限制:这样的处理器一次只能处理少量数据。
虽然GPU可以使用更大的数据集执行多个任务,但它们最初并不是为机器学习和AI开发的。
特斯拉的AI芯片专利内容如下:
“用于机器学习和人工智能的处理通常需要对大量数据集执行数学运算,并且通常涉及求解多个卷积层和汇集层。”
为了解决这个问题,特斯拉必须开发一种新的神经AI,可以进行“机器学习和人工智能特定的处理操作”。
因此,特斯拉提交了一些专利:
- 加速的数学引擎
- 具有可变延迟存储器访问的计算阵列微处理器系统
- 使用非连续数据格式的计算阵列微处理器系统
- 矢量计算单位。
目前,Autopilot 2.0的计算机组件由英伟达GPU提供支持。
同时,即将推出的升级版本将取代特斯拉目前使用的Autopilot 2.0平台,使用AI芯片的Autopilot 3.0能够在汽车中实现全自动驾驶功能。
参考资料:
https://medium.com/waymo/learning-to-drive-beyond-pure-imitation-465499f8bcb2
https://www.theinformation.com/articles/what-makes-teslas-autopilot-different
https://www.reddit.com/r/MachineLearning/comments/aklwv8/n_report_tesla_is_using_behavior_cloning_ie/
相关推荐
- Mysql和Oracle实现序列自增(oracle创建序列的sql)
-
Mysql和Oracle实现序列自增/*ORACLE设置自增序列oracle本身不支持如mysql的AUTO_INCREMENT自增方式,我们可以用序列加触发器的形式实现,假如有一个表T_WORKM...
- 关于Oracle数据库12c 新特性总结(oracle数据库19c与12c)
-
概述今天主要简单介绍一下Oracle12c的一些新特性,仅供参考。参考:http://docs.oracle.com/database/121/NEWFT/chapter12102.htm#NEWFT...
- MySQL CREATE TABLE 简单设计模板交流
-
推荐用MySQL8.0(2018/4/19发布,开发者说同比5.7快2倍)或同类型以上版本....
- mysql学习9:创建数据库(mysql5.5创建数据库)
-
前言:我也是在学习过程中,不对的地方请谅解showdatabases;#查看数据库表createdatabasename...
- MySQL面试题-CREATE TABLE AS 与CREATE TABLE LIKE的区别
-
执行"CREATETABLE新表ASSELECT*FROM原表;"后,新表与原表的字段一致,但主键、索引不会复制到新表,会把原表的表记录复制到新表。...
- Nike Dunk High Volt 和 Bright Spruce 预计将于 12 月推出
-
在街上看到的PandaDunk的超载可能让一些球鞋迷们望而却步,但Dunk的浪潮仍然强劲,看不到尽头。我们看到的很多版本都是为女性和儿童制作的,这种新配色为后者引入了一种令人耳目一新的新选择,而...
- 美国多功能舰载雷达及美国海军舰载多功能雷达系统技术介绍
-
多功能雷达AN/SPY-1的特性和技术能力,该雷达已经在美国海军服役了30多年,其修改-AN/SPY-1A、AN/SPY-1B(V)、AN/SPY-1D、AN/SPY-1D(V),以及雷神...
- 汽车音响怎么玩,安装技术知识(汽车音响怎么玩,安装技术知识视频)
-
全面分析汽车音响使用或安装技术常识一:主机是大多数人最熟习的音响器材,有关主机的各种性能及规格,也是耳熟能详的事,以下是一些在使用或安装时,比较需要注意的事项:LOUDNESS:几年前的主机,此按...
- 【推荐】ProAc Response系列扬声器逐个看
-
有考牌(公认好声音)扬声器之称ProAcTablette小音箱,相信不少音响发烧友都曾经,或者现在依然持有,正当大家逐渐掌握Tablette的摆位设定与器材配搭之后,下一步就会考虑升级至表现更全...
- #本站首晒# 漂洋过海来看你 — BLACK&DECKER 百得 BDH2000L无绳吸尘器 开箱
-
作者:初吻给了烟sco混迹张大妈时日不短了,手没少剁。家里有了汪星人,吸尘器使用频率相当高,偶尔零星打扫用卧式的实在麻烦(汪星人:你这分明是找借口,我掉毛是满屋子都有,铲屎君都是用卧式满屋子吸的,你...
- 专题|一个品牌一件产品(英国篇)之Quested(罗杰之声)
-
Quested(罗杰之声)代表产品:Q212FS品牌介绍Quested(罗杰之声)是录音监听领域的传奇品牌,由英国录音师RogerQuested于1985年创立。在成立Quested之前,Roger...
- 常用半导体中英对照表(建议收藏)(半导体英文术语)
-
作为一个源自国外的技术,半导体产业涉及许多英文术语。加之从业者很多都有海外经历或习惯于用英文表达相关技术和工艺节点,这就导致许多英文术语翻译成中文后,仍有不少人照应不上或不知如何翻译。为此,我们整理了...
- Fyne Audio F502SP 2.5音路低音反射式落地音箱评测
-
FyneAudio的F500系列,有新成员了!不过,新成员不是新的款式,却是根据原有款式提出特别版。特别版产品在原有型号后标注了SP字样,意思是SpecialProduction。Fyne一共推出...
- 有哪些免费的内存数据库(In-Memory Database)
-
以下是一些常见的免费的内存数据库:1.Redis:Redis是一个开源的内存数据库,它支持多种数据结构,如字符串、哈希表、列表、集合和有序集合。Redis提供了快速的读写操作,并且支持持久化数据到磁...
- RazorSQL Mac版(SQL数据库查询工具)
-
RazorSQLMac特别版是一款看似简单实则功能非常出色的SQL数据库查询、编辑、浏览和管理工具。RazorSQLformac特别版可以帮你管理多个数据库,支持主流的30多种数据库,包括Ca...
你 发表评论:
欢迎- 一周热门
-
-
前端面试:iframe 的优缺点? iframe有那些缺点
-
带斜线的表头制作好了,如何填充内容?这几种方法你更喜欢哪个?
-
漫学笔记之PHP.ini常用的配置信息
-
其实模版网站在开发工作中很重要,推荐几个参考站给大家
-
推荐7个模板代码和其他游戏源码下载的网址
-
[干货] JAVA - JVM - 2 内存两分 [干货]+java+-+jvm+-+2+内存两分吗
-
正在学习使用python搭建自动化测试框架?这个系统包你可能会用到
-
织梦(Dedecms)建站教程 织梦建站详细步骤
-
【开源分享】2024PHP在线客服系统源码(搭建教程+终身使用)
-
2024PHP在线客服系统源码+完全开源 带详细搭建教程
-
- 最近发表
-
- Mysql和Oracle实现序列自增(oracle创建序列的sql)
- 关于Oracle数据库12c 新特性总结(oracle数据库19c与12c)
- MySQL CREATE TABLE 简单设计模板交流
- mysql学习9:创建数据库(mysql5.5创建数据库)
- MySQL面试题-CREATE TABLE AS 与CREATE TABLE LIKE的区别
- Nike Dunk High Volt 和 Bright Spruce 预计将于 12 月推出
- 美国多功能舰载雷达及美国海军舰载多功能雷达系统技术介绍
- 汽车音响怎么玩,安装技术知识(汽车音响怎么玩,安装技术知识视频)
- 【推荐】ProAc Response系列扬声器逐个看
- #本站首晒# 漂洋过海来看你 — BLACK&DECKER 百得 BDH2000L无绳吸尘器 开箱
- 标签列表
-
- mybatis plus (70)
- scheduledtask (71)
- css滚动条 (60)
- java学生成绩管理系统 (59)
- 结构体数组 (69)
- databasemetadata (64)
- javastatic (68)
- jsp实用教程 (53)
- fontawesome (57)
- widget开发 (57)
- vb net教程 (62)
- hibernate 教程 (63)
- case语句 (57)
- svn连接 (74)
- directoryindex (69)
- session timeout (58)
- textbox换行 (67)
- extension_dir (64)
- linearlayout (58)
- vba高级教程 (75)
- iframe用法 (58)
- sqlparameter (59)
- trim函数 (59)
- flex布局 (63)
- contextloaderlistener (56)