99久久国产综合精品女,大陆嫩模私拍视频

特斯拉 FSD V12 試駕平平無(wú)奇？

2023-09-01 04:02:32來(lái)源： 賽博汽車

作者 | EatElephant

編輯 | 章漣漪

當(dāng)?shù)貢r(shí)間 8 月 26 日，特斯拉 CEO 馬斯克親自上線，開(kāi)啟了一場(chǎng)路測(cè)特斯拉 FSD V12 的直播。試駕過(guò)程中，馬斯克多次表示現(xiàn)在的系統(tǒng)沒(méi)有一行規(guī)則和條件判斷代碼，不需要高清地圖，甚至不需要聯(lián)網(wǎng)就可以完成一切。

(資料圖)

直播全程 45 分鐘，吸引超 1000 萬(wàn)人在線圍觀。其中，馬斯克只有一次駕駛干預(yù)，這發(fā)生在一個(gè)繁忙的十字路口，馬斯克所駕駛的特斯拉試圖闖紅燈，他立即控制了車輛。

從技術(shù)上看，特斯拉 FSD V12 版本采用的是端到端的大模型技術(shù)，即：一端輸入環(huán)境圖像，一端輸出控制指令，中間是一個(gè)神經(jīng)網(wǎng)絡(luò)大模型，這幾乎是接近人類真實(shí)駕駛。

針對(duì)這一事件，以及特斯拉 FSD V12 技術(shù)背后的邏輯，AI 算法工程師 EatElephant 進(jìn)行了解讀，賽博汽車授權(quán)進(jìn)行編發(fā)。

以下為《賽博汽車》依照 EatElephant 的文章整理改編而成——

其實(shí)挺驚訝對(duì)這次 demo 的評(píng)價(jià)目前看來(lái)還是比較負(fù)面的，從消費(fèi)者角度其實(shí)這可以理解，畢竟 19min 就接管一次，還是闖紅燈這種極其普遍的駕駛場(chǎng)景中的致命錯(cuò)誤，不過(guò)要知道這并非發(fā)布的用戶版本，而是研發(fā)內(nèi)測(cè)的 Alpha 版本，說(shuō)一個(gè)研發(fā)版本不夠完善穩(wěn)定我個(gè)人感覺(jué)是有點(diǎn)吹毛求疵了。

作為技術(shù)從業(yè)者，我們更應(yīng)該從更加技術(shù)的角度去看待 FSD Version 12 的這次 demo，我個(gè)人認(rèn)為這次 demo 給我?guī)?lái)的沖擊和引起的思考是比較大的，甚至不輸于以往的幾次 AI Day 和 Autonomous Day。

首先要知道為什么大家對(duì) V12 如此感興趣。原因是老馬在今年 5 月份就爆了一劑猛料，F(xiàn)SD V12 會(huì)徹底轉(zhuǎn)向端到端的自動(dòng)駕駛技術(shù)方案，并且他還說(shuō) V12 會(huì)令 FSD 走出 Beta 階段徹底成為一個(gè)正式版的產(chǎn)品。

老馬 5 月宣布 Version12 將轉(zhuǎn)為端到端系統(tǒng)的 Twitter（X）

這個(gè)消息的噱頭有多大呢，我感覺(jué)吧其實(shí)不輸于 2020 年公布 FSD Beta 將于當(dāng)年 10 月發(fā)布，畢竟端到端的自動(dòng)駕駛長(zhǎng)期以來(lái)一直局限于學(xué)術(shù)研究中，Tesla 之前唯二的先行者 Comma 僅僅只能進(jìn)行高速方面的簡(jiǎn)單駕駛動(dòng)作，Wayve 則局限于英國(guó)少數(shù)地區(qū)的內(nèi)部測(cè)試，而要知道 FSD 可是在廣大的北美大陸可以任意開(kāi)啟的，這需要端到端系統(tǒng)體現(xiàn)的泛化性可以說(shuō)和前兩者相比要高出一個(gè)層級(jí) 。

業(yè)內(nèi)普遍共識(shí)，端到端的自動(dòng)駕駛系統(tǒng)理論上有比現(xiàn)今模塊化的自動(dòng)駕駛系統(tǒng)更高的能力上限，那么端到端系統(tǒng)為什么并沒(méi)有成為業(yè)界主流呢？

原因是端到端系統(tǒng)在提高模型上限的同時(shí)也無(wú)限放大了神經(jīng)網(wǎng)絡(luò)黑盒的不可解釋的問(wèn)題，而不可解釋性會(huì)給研發(fā)迭代和問(wèn)題解決造成巨大的負(fù)面影響，同時(shí)業(yè)界也沒(méi)有端到端系統(tǒng)的成功先例，對(duì)于這種處于前沿科技無(wú)人區(qū)的技術(shù)方案絕大多數(shù)公司是沒(méi)有勇氣和實(shí)力敢為天下先的。

那作為端到端的 V12 首次公開(kāi)亮相，我認(rèn)為這次 demo 是毫無(wú)疑問(wèn)的成功的，甚至是驚艷的。我的理由主要有以下三點(diǎn)：

1. 本次 Demo 展現(xiàn)了 FSD V12 端到端系統(tǒng)的成熟度

很多國(guó)內(nèi)外的網(wǎng)友質(zhì)疑這次 Demo 的路況場(chǎng)景都十分簡(jiǎn)單，Palo Alto 的交通即使在下班高峰看起來(lái)也遠(yuǎn)遠(yuǎn)比不了國(guó)內(nèi)大城市道路的擁擠繁雜，在這種情況下甚至還有一次嚴(yán)重問(wèn)題接管，其實(shí)算不上優(yōu)秀，對(duì)于這個(gè)觀點(diǎn)我其實(shí)很認(rèn)同。

然而作為自動(dòng)駕駛的算法從業(yè)者，我對(duì)于這次 demo 的關(guān)注點(diǎn)其實(shí)不在場(chǎng)景的困難程度，因?yàn)槔碚撋隙说蕉说南到y(tǒng)自然比基于規(guī)則和搜索的現(xiàn)今主流自動(dòng)駕駛系統(tǒng)上限高很多，其核心問(wèn)題在于下限可能很低。

端到端系統(tǒng)起步慢但上限高

今年 CVPR 小鵬的 Patrick 有這樣一個(gè)圖表很好的說(shuō)明了端到端系統(tǒng)的特性，可以看到端到端的系統(tǒng)最大問(wèn)題在于模型能力起步較慢，同時(shí)黑盒不可解釋不可控的性質(zhì)會(huì)導(dǎo)致系統(tǒng)雖然能夠處理復(fù)雜場(chǎng)景，但是簡(jiǎn)單場(chǎng)景很可能相比目前主流系統(tǒng)會(huì)產(chǎn)生退步，甚至是犯很多 " 弱智 " 的錯(cuò)誤，同時(shí)因?yàn)闃I(yè)界缺乏端到端系統(tǒng)的工程實(shí)踐經(jīng)驗(yàn)，一些看似簡(jiǎn)單的 fix 無(wú)法通過(guò)增加規(guī)則代碼迅速解決，因此嘗試端端到端的方案大多數(shù)時(shí)候可能會(huì)是死在起跑線。

實(shí)際上我甚至認(rèn)為如果哪家公司能夠利用端到端的新技術(shù)架構(gòu)來(lái)獲得一個(gè)功能穩(wěn)定性匹敵現(xiàn)有技術(shù)架構(gòu)的自動(dòng)駕駛系統(tǒng)，那么基本可以證明端到端系統(tǒng)是未來(lái)方向。

因?yàn)?，理論上端到端系統(tǒng)在達(dá)到現(xiàn)有技術(shù)水平的那個(gè)時(shí)間點(diǎn)之后會(huì)很快繼續(xù)提高水平將現(xiàn)有技術(shù)棧甩在身后，所以上圖紅藍(lán)線交叉的點(diǎn)我認(rèn)為可以稱作端到端系統(tǒng)正收益的爆發(fā)點(diǎn)，一旦達(dá)到這一點(diǎn)基本上主流的技術(shù)范式就會(huì)被顛覆。

所以，考慮到 Tesla V12 應(yīng)該研發(fā)時(shí)間不長(zhǎng)，我對(duì)于 V12 首秀能在隨機(jī)選取的測(cè)試路線上在眾多基礎(chǔ)的轉(zhuǎn)彎，變道，環(huán)島，與行人交互等場(chǎng)景表現(xiàn)十分穩(wěn)定平順其實(shí)是非常驚訝的，而 FSD V12 的這次初次亮相部分說(shuō)明了 Tesla 已經(jīng)比較接近這個(gè)爆發(fā)點(diǎn)了，而這是我認(rèn)為本次 Demo 傳遞的十分重要的信號(hào)。

2. 透露了 Tesla 端到端自動(dòng)駕駛的一些重要的思路，理念和實(shí)踐經(jīng)驗(yàn)

這次 Demo 另一個(gè)關(guān)鍵意義在于，通過(guò) Demo 的一些細(xì)節(jié)以及直播過(guò)程中老馬和 Ashok 的聊天透露了很多 Tesla 對(duì)于端到端系統(tǒng)的實(shí)操經(jīng)驗(yàn)和理解，而在端到端系統(tǒng)嚴(yán)重缺乏行業(yè)最佳實(shí)踐的現(xiàn)在，這毫無(wú)疑問(wèn)是對(duì)技術(shù)從業(yè)者具有啟發(fā)意義的。

比如說(shuō)，很多人以為端到端是一個(gè)中間完全不透明的黑盒，但是實(shí)際上目前大多數(shù)比較深入的端到端實(shí)踐都表明保持端到端系統(tǒng)中間結(jié)果的可解釋性是很重要的。

今年 CVPR Best Paper UniAD 就設(shè)計(jì)了一個(gè)端到端可導(dǎo)但是保留了中間子網(wǎng)絡(luò)輸出的端到端系統(tǒng)，而從直播中可以發(fā)現(xiàn) V12 幾乎完整的保留了當(dāng)前 FSD 的感知結(jié)果輸出，很顯然至少在目前階段 Tesla 的端到端技術(shù)方案也是保留中間功能子網(wǎng)絡(luò)的路徑。

那這個(gè)方案和普通的模塊化方案有什么區(qū)別呢？

其實(shí)重要區(qū)別在于各模塊都去除了基于規(guī)則的代碼，使得整個(gè)系統(tǒng)端到端可導(dǎo)，這使得整個(gè)系統(tǒng)作為一個(gè)整體直接對(duì)于駕駛動(dòng)作進(jìn)行訓(xùn)練優(yōu)化成為可能。而傳統(tǒng)的自動(dòng)駕駛架構(gòu)由于模塊化以及并非端到端可導(dǎo)，使得各個(gè)功能模塊只能通過(guò)各自訓(xùn)練優(yōu)化自己的任務(wù)，最終結(jié)果是多個(gè)局部最優(yōu)無(wú)法實(shí)現(xiàn)整個(gè)系統(tǒng)的全局最優(yōu)。

CVPR 2023 Best Paper UniAD 保留了整個(gè)系統(tǒng)中間的各個(gè)功能網(wǎng)絡(luò)

這樣的方案其實(shí)比較好理解，保留中間結(jié)果相當(dāng)于通過(guò)人類先驗(yàn)知識(shí)把人類覺(jué)得有用的駕駛概念提取出來(lái)，給到端到端下游網(wǎng)絡(luò)，也給到網(wǎng)絡(luò)的還有可能包括更加前端基礎(chǔ)的輸入，由下游決策規(guī)劃網(wǎng)絡(luò)自由選擇使用哪些信息進(jìn)行判斷，這樣的技術(shù)方案通過(guò)人類先驗(yàn)加快了端到端系統(tǒng)訓(xùn)練時(shí)性能起步速度，但是又保留了原始信息直接輸入下游，減少了傳統(tǒng)模塊話系統(tǒng)中間輸輸出導(dǎo)致的信息損失。

同時(shí)，對(duì)中間結(jié)果進(jìn)行分析也有助于確定系統(tǒng)犯錯(cuò)時(shí)問(wèn)題的原因，提高解決問(wèn)題的效率。

V12 幾乎保留全部 FSD 感知結(jié)果可視化效果，但似乎沒(méi)有紅綠燈可視化

另外馬斯克和 Ashok 在聊天過(guò)程中反復(fù)強(qiáng)調(diào) V12 沒(méi)有顯式的把車道線，環(huán)島，減速帶等概念的處理辦法灌輸給系統(tǒng)，對(duì)于這點(diǎn)我的理解是 V12 并不是沒(méi)有檢測(cè)這些內(nèi)容，而是在規(guī)控網(wǎng)絡(luò)中沒(méi)有顯式的添加如何應(yīng)對(duì)這些概念的規(guī)則，應(yīng)對(duì)方法是由網(wǎng)絡(luò)自己通過(guò)駕駛員視頻學(xué)習(xí)得到的。

例如，軟件沒(méi)有顯示要求自車要在車道線居中，模型自己從人類駕駛視頻中學(xué)習(xí)何時(shí)應(yīng)該居中，何時(shí)可以適當(dāng)偏離中線以達(dá)成更加擬人的駕駛決策。

3. 展現(xiàn)了端到端自動(dòng)駕駛系統(tǒng)相比傳統(tǒng)架構(gòu)優(yōu)勢(shì)的一些閃光點(diǎn)

雖然上面說(shuō)了，我更加關(guān)注的是 V12 相比現(xiàn)有 FSD 是否在基礎(chǔ)功能上存在性能回退，但是在這次 Demo 中我們也看到了很多 V12 的閃光點(diǎn)。

這次的一個(gè)大家容易忽略的亮點(diǎn)其實(shí)就發(fā)生在老馬第 19min 紅綠燈接管之前。

當(dāng)時(shí)的場(chǎng)景是這樣的，直行的綠燈亮起但是前方路口擁堵，這時(shí)比較合理的駕駛決策是不要進(jìn)入路口，等待目標(biāo)路口空間出現(xiàn)再選擇通過(guò)路口，而 FSD V12 也正是這樣做（不要糾結(jié)國(guó)內(nèi)國(guó)情，實(shí)際上我國(guó)的交規(guī)也是這樣建議的，雖然很少有人按照?qǐng)?zhí)行），不過(guò)這也導(dǎo)致了這次綠燈 V12 沒(méi)能通行，一直到綠燈變紅，再下一次左轉(zhuǎn)綠燈亮起的時(shí)候 V12 出現(xiàn)了誤判。

上述情況出行的原因是：V12 目前似乎并不直接檢測(cè)紅綠燈的狀態(tài)（可視化界面中好像不再出現(xiàn)紅綠燈檢測(cè)結(jié)果），而是綜合參考了紅綠燈情況和周圍其他這輛行為來(lái)判斷是否應(yīng)該通行，所以當(dāng)有紅燈變綠，且周圍左轉(zhuǎn)車輛開(kāi)始移動(dòng)的時(shí)候，V12 產(chǎn)生了錯(cuò)誤判斷，認(rèn)為直行也已經(jīng)可以通行，造成接管。

直行綠燈但路口擁堵，V12 選擇等待，沒(méi)有進(jìn)入路口

第二個(gè)亮點(diǎn)出現(xiàn)在一次途徑點(diǎn)到達(dá)過(guò)程中，V12 可以進(jìn)行靠邊停車的操作，而這也是目前的 FSD 所不具備的功能。

而且 Ashok 在直播過(guò)程還透露，未來(lái) FSD 甚至可以響應(yīng)用戶語(yǔ)音指令輸入。例如用戶可以告訴 FSD 向左換道，或者告訴 FSD 帶自己到達(dá)前面沃爾瑪，F(xiàn)SD 就會(huì)根據(jù)語(yǔ)音指令分析其中語(yǔ)義信息并執(zhí)行相應(yīng)動(dòng)作。這里我的猜測(cè)是有可能在 V12 的模型中也有文字模態(tài)的加入，這也是目前自動(dòng)駕駛系統(tǒng)中很少使用的新技術(shù)，隨著大語(yǔ)言模型的爆炸式發(fā)展，在自動(dòng)駕駛中融入語(yǔ)言模型這一方向也給人很大的遐想空間。

總之這次 FSD V12 的 Demo 可以說(shuō)是自動(dòng)駕駛行業(yè)內(nèi)一次具有顛覆性的事件，雖然本次 demo 依然存在問(wèn)題，也還無(wú)法完全證明端到端系統(tǒng)就是自動(dòng)駕駛未來(lái)的前進(jìn)方向，但是隨著本次 demo 的展示，我相信端到端的自動(dòng)駕駛很可能將擺脫空中樓閣的尷尬境地，有潛力成為未來(lái)幾年內(nèi)行業(yè)爭(zhēng)先投入的重點(diǎn)。

作為行業(yè)領(lǐng)軍的 Tesla（也許有人不認(rèn)同，但是我身邊的從業(yè)者絕大多數(shù)對(duì)此是承認(rèn)或者默認(rèn)的）再次扮演了敢為天下先的角色，后續(xù)自動(dòng)駕駛技術(shù)范式到底如何迭代，這次 demo 的意義可能比很多人想象的更加深遠(yuǎn)。

關(guān)鍵詞：

相關(guān)新聞