“偷感很重”!所谓的“端到端”谜局,不买才是最妥?
在最新的第四届沈阳智能网联汽车挑战赛上,同济大学教授朱西产对时下很火的“端到端”智能驾驶进行了评价。
他表示“端到端”被特斯拉带火了,现在国内的车企都在说端到端,不过也很好判断。如果谁宣布端到端上车了,他家的车也就别买了。
此前余承东也对特斯拉最新版本的FSD进行了评价,不过老余就委婉多了,他表示“端到端”的上限很高,但下限是很低的,测试的时候分别撞了白色和绿色的货车。
“端到端”智驾的优势和命门究竟在哪?教授说不能买有依据吗?让功夫汽车带大家一起看一下。
(1)何谓“端到端”?
最近“端到端”这个词特别火,这其实是一个网络概念。比如要将数据从A传送到G,中间过程可能是A→B→C→D→E→F→G,传输层并不知道B,C,D,E,F的存在,只认为是从A到G,这就是端到端。
对于智能驾驶来说,就是一端输入原始数据,另一端反馈出控制数据,中间是神经网络计算模块,没有任何人为设计的规则模块。
目前主流的智能驾驶系统依然是分模块运行的,包括感知、规划和控制。就是传感器对周围环境进行准确感知,系统规划行车轨迹,然后执行机构对车辆进行闭环控制。
而特斯拉FSD的端到端大模型,就取消了感知到定位、决策到规划、控制到执行中间的断面,把这三大模块融合到了一起,做成了一个大的神经网络。中间的这些决策、控制准则全部没有了,而是用的一个AI泛化模型。
简单来说就像传统围棋电脑对比阿尔法狗,传统电脑是你给出一步,它从系统里调出应对的一步,它的“走法”几乎就是确定的。而阿尔法狗是对你这一步进行分析,然后给出回应。给出的传感器数据千变万化,系统的回应也是千变万化。
在特斯拉的端到端模型中,各个AI模块通过transformer链接,信息传递更加隐秘,减少了信息传输过程中的丢失,同时还能让整个网络实现优化,这也就是余承东说的上限很高。理论上这条路如果走通了,前景是非常好的。
但问题也有,那就是AI去掉准则模型后,很难知道它的下限在哪。比如我们现在的智能驾驶,都是从ACC自适应巡航,到高速NOA,再到城市NOA,行驶跟车能力是由易到难一步步培养出来的。简单来说,高速的车道保持和跟车做好了,才能做导航自动规划路线,自动行驶,才能应付市区更加复杂的路况。
而现在的端到端,如果真的按照特斯拉那条路走,可能非常复杂的场景也能处理,同时也可能旁边一个垃圾桶都识别不到。特斯拉FSD上到 V12版本后,确实泛化能力提升了不少,不再严格按照之前的“准则”进行,系统“开起来”更像老司机了。但出现的问题也不少,比如之前就有撞到一名摩托车手,这种情况在上一个版本是很难出现的。
(2)端到端“好做”,但难题难解
前面我们说了,端到端的处理方式有点类似阿尔法狗,可能很多人就觉得这个技术非常牛了。但现实情况是阿尔法狗用了谷歌云上50个左右的TPU,对比普通的i7四核八线程处理器的话,它的算力相当于300~500台左右的PC主机。
这么强大的算力,只是处理围棋这么一个相对小众的场景。而智能驾驶的场景更加复杂,端对端所需要的算力无疑更加可怕。显然,在车上布置一台类似阿尔法狗的设备是不现实的,其实特斯拉也是循序渐进。
2019年,特斯拉推出了“影子模式”(shadow mode),开始做车端数据触发采集。就是智能驾驶软件在车辆后台运行,但不参加车辆的控制。当软件决策与人类驾驶员的操作不一致时,系统会采集一段约60秒的传感器数据日志发回云端服务器。特斯拉反复记录这些数据,对模型进行持续的训练和迭代。
这个核心其实也是将一些数据进行“打包”,确保传感器输入一部分数据后,控制机构给出合理的回应。目前FSD的累计行驶里程已经超过10亿英里,特斯拉采集到了千万量级的车端数据,这是如今端到端的基础。
只是特斯拉在北美采集的这些数据,到国内能发挥多大的效用,依然是未知数。国内车企就更不用说了,目前在智能驾驶开发的数据能力和AI训练算力都很有限。如果贸然做端到端,问题可能会更多。这也是教授说先上车的别买的原因,因为一定是不成熟的。
(3)晦涩难懂?那就别懂了
特斯拉的端到端出来后,国内各大媒体做了多轮解读,小鹏、理想、上汽等车企也纷纷下场,表示自家的端到端大模型马上也要量产上车。
这让很多消费者很焦急,因为他们理解来理解去,就是弄不懂这个端到端究竟是啥,确实非常晦涩。但个人看来,真正好用的东西,从来不是它的原理有多牛,而是它确实好用。消费者不是“讲明白”的,而是“用明白”的。
最简单的,网络支付兴起也就十来年的时间,2013年微信支付正式上线,如今七八线农村的老奶奶都会用二维码收款了,是因为技术讲得透彻吗?当然不是,是因为这玩意确实好用呀。包括智能手机,兴起也就十多年,已经基本淘汰了非智能手机。鸿蒙系统上线也就这两年的时间,能更新的基本也都更新了。
智能座舱、智能驾驶出现的时间也不长,现在中年人买车都知道要高通8295,为啥?因为提供的功能确实好用呀。车企刚开始做车内“可见即可说”的时候,就得到了消费者的一致认可,也是因为确实足够实用。消费者对于新技术的接受度评价标准其实非常简单,就是足够好用。
因此ACC也好、高速NOA也好、城市NOA也好,消费者不接受只有一种可能,就是花大价钱选配的功能体验压根跟不上。端到端也会是一样,车企做它们的,如果做得好,自然很快就会普及。反之天天说自己先进,也不会有人买账。
(4)功夫拍案
关于端到端这件事,其实余承东说得很隐晦,上限很高,下限很低。说直白点,就是吹牛的空间很大,但很多基础的问题很难解决。端到端做到现在,每家车企各执一词,越来越听不懂,偷感非常重。
出现这种现象,本质就是技术还不成熟。要是成熟的东西,一定是一两句话能够说清楚的,并且是上来就很好用的。反正大家从诺基亚切换到安卓、IOS时,都没有任何的“过渡期”。第一次用高速NOA时,也是直接上手。第一次用360影像的时候,也没有任何的使用瓶颈。
如果厂家表述得非常晦涩,甚至听不懂是个什么东西,那别买就是了,大家觉得呢?