1. 首頁
  2. 大牛說
  3. 特斯拉自動駕駛在中國為何不如小鵬?

特斯拉自動駕駛在中國為何不如小鵬?

圖片

我們有信心,在今年年內(nèi)推出來的城市NGP效果,會相當(dāng)程度上比FSD的效果要好。”3月26日,何小鵬百人會論壇上向《電動汽車觀察家》明確表示,小鵬汽車將于2026年開始向無人駕駛過渡的目標。

此時距離何小鵬喊話特斯拉創(chuàng)始人馬斯克——“(要)在中國的自動駕駛領(lǐng)域打得(特斯拉)找不著東”剛過去16個月。 

圖片

何小鵬2020年社交媒體發(fā)言

當(dāng)然特斯拉也沒閑著。

4月,馬斯克表示可實現(xiàn)“完全自動駕駛能力”的FSD測試版已搭載在超10萬輛特斯拉車型上。近日發(fā)布的特斯拉2021年影響力報告表示,美國所有汽車相比于使用Autopilot自動輔助駕駛的特斯拉汽車發(fā)生事故的概率要高8倍。馬斯克表示,這項數(shù)據(jù)將趨向于超過10倍。

但在中國,由于開放功能過少,昂貴的FSD對特斯拉車主來說品牌標簽的意義遠大于使用價值。

2020年的小鵬科技日上,一段小鵬NPG/特斯拉NoA導(dǎo)航領(lǐng)航駕駛輔助系統(tǒng)的對比實驗中,小鵬P7表現(xiàn)穩(wěn)定,特斯拉Model3則有了一系列無故、違規(guī)變道和錯誤駛出的情況發(fā)生。

這一表現(xiàn)也與中國媒體屢次的對比測試結(jié)果一致:在北美開始測試完全自動駕駛的特斯拉,在中國結(jié)構(gòu)化道路上仍水土不服。

晚七年出發(fā)的小鵬,現(xiàn)在的自動駕駛能力能否與特斯拉一較高下?何小鵬說要趕超特斯拉,是在吹牛嗎?

更重要的是,以特斯拉和小鵬為代表的純視覺和感知融合兩大技術(shù)路線,在量產(chǎn)自動駕駛這一目標下的差異怎樣,前景又如何?

01

在中國,特斯拉比小鵬“差”在哪兒?

本質(zhì)上,如今的純視覺感知的特斯拉車型,和依靠多傳感器融合的小鵬車型已是運行模式大相徑庭的兩種“生物”,且“棲息地”也大為不同。

1.1 | 純視覺VS多傳感器融合

特斯拉FSD完全靠“看”。車身四周的8枚攝像頭,以每個攝像頭36幀每秒的速率采集,分辨率為1280×960、12-Bit的RAW格式圖像。

原始圖像數(shù)據(jù)直接進入名為“HydraNets(九頭蛇)”的單一純視覺神經(jīng)網(wǎng)絡(luò)算法中,進行圖像拼接、物體分類、目標跟蹤、引入時間序列的在線標定、視覺SLAM(定位與地圖構(gòu)建)等一系列能讓機器明白“我拍的是什么”,最終形成一段路況時空的“向量空間”——對真實物理世界的虛擬映射。

最困難的是建立一個準確的向量空間,”馬斯克表示,“一旦有了準確的向量空間,控制問題就類似于電子游戲。

圖片

向量空間,特斯拉AI DAY 2021年8月

“向量空間”是所有L3級及以上高階駕駛輔助系統(tǒng)的必要條件,區(qū)別在于如何獲?。ǜ兄┱鎸嵤澜绲臄?shù)據(jù)。

從P7開始,XPILOT智能駕駛輔助系統(tǒng)(下稱XPILOT)形成了“小鵬風(fēng)格”的融合感知系統(tǒng):前視三目攝像頭+翼子板側(cè)后視攝像頭+反光鏡前視攝像頭+后視攝像頭+五個毫米波雷達+四個環(huán)視攝像頭+十二個超聲波雷達+高精地圖+高精定位。

從P5開始,XPILOT又引入了激光雷達。

圖片

小鵬P5將適用城市NGP

雷達提供直接的速度、深度、距離和部分材質(zhì)信息,其中激光雷達能夠直接對現(xiàn)實場景進行3D點云的虛擬建模;攝像頭則對行人、交通標志標線等多細節(jié)進行感知。之后,通過融合算法模式,將不同傳感器的原始數(shù)據(jù)或感知結(jié)果進行4D一致化的融合,由此建立向量空間。

兩套方案各有優(yōu)劣。

視覺方案具有極大的成本優(yōu)勢。單目攝像頭成本僅在150-600 元之間,較為復(fù)雜的三目攝像頭成本也通常在1000 元以內(nèi)。

特斯拉的8個攝像頭成本在200美元(1400元)之內(nèi),加上自研的自動駕駛芯片,總成本不到1萬元人民幣。

多傳感器融合方案在攝像頭之外,毫米波雷達成本在50美元左右、半固態(tài)激光雷達普遍在幾百美元,以及高精地圖的費用。

2019年,高德地圖宣布100元/車/年的標準化高精地圖合作價格。但頭豹研究院在報告中認為,除基礎(chǔ)服務(wù)外,高精地圖圖商還收取輔助自動駕駛服務(wù)費,行業(yè)價格或為700-800元/車/年。

成本是技術(shù)量產(chǎn)規(guī)模的決定性因素,但技術(shù)的可靠性和可實現(xiàn)性更加重要。

距離/深度/速度探測是視覺方案的劣勢之一,要通過2D的圖像來構(gòu)建3D+時間的向量空間,中間不但存在2D“翻譯”到3D所帶來的延遲問題,而且對圖像處理算法、AI學(xué)習(xí)所用的場景數(shù)量/質(zhì)量,和硬件算力都要求極高。

例如,去年特斯拉取消毫米波雷達之后,F(xiàn)SD測試版的自動轉(zhuǎn)向功能設(shè)置了75 英里/小時(120公里/小時)的最高速度和最少三輛車的跟車距離。之后兩個月,特斯拉將限速提高至80英里/小時(128公里/小時),跟車距離降低到兩個車身長度。

多傳感器方案則擁有雷達直接提供的距離/深度/速度數(shù)據(jù),以及高精地圖提供超視距的先驗信息,以及高精定位模塊提供的分米甚至厘米級定位能力。

“(由此)幫助AI理解,決策和規(guī)劃接下來的動作,為基于其他傳感器的感知能力提供輔助和冗余的信息來源。”小鵬汽車自動駕駛副總裁吳新宙向《電動汽車觀察家》表示。

圖片

自動駕駛各級別對應(yīng)像素數(shù)、數(shù)據(jù)量以及算力需求(估計值)《中金 | AI十年展望》

獲得足夠的冗余,是L4級自動駕駛公司和小鵬等公司,選擇多傳感器融合而非純視覺路線的主要原因。

目前,由于純視覺沒有對速度、加速度的直接測量能力,幽靈剎車會是長期難以根治的問題。

未來,對高階自動駕駛系統(tǒng)所需要的預(yù)期功能安全和功能安全來說,防止單一系統(tǒng)失效,收窄失效預(yù)期冗余是必須的,“目前純視覺系統(tǒng)很難達到高階自動駕駛所需的安全需求。”一位自動駕駛領(lǐng)域?qū)<蚁颉峨妱悠囉^察家》表示。

1.2 美國的特斯拉與中國的小鵬

“棲息地”的不同進一步加大了兩條技術(shù)路線的落地表現(xiàn)。

中國交通環(huán)境的復(fù)雜程度遠超美國,需要大量視距之外的輔助信息提供給決策系統(tǒng),才能順利完成通行,也導(dǎo)致僅依賴實時、純視覺感知系統(tǒng),很難在中國落地。

圖片

中、美最復(fù)雜的立交橋系統(tǒng):美國亞特蘭大(左)與中國重慶

例如,即使是屬于簡單場景的封閉高速路,中國相比美國路彎道更多、曲率更大,甚至有兩圈疊套的路段,能“一眼看到”的路線非常短暫;中國的高速路還有更長的進出匝道,和更頻繁變換的虛實車道線,甚至本不應(yīng)出現(xiàn)在封閉路上的行人。

部分企業(yè)在實踐中發(fā)現(xiàn),由于交通參與者通行規(guī)范程度的差異,自動駕駛系統(tǒng)在美國過路口比中國“容易”近10倍。

不使用高精地圖,缺乏先驗信息,完全依靠視覺感知,神經(jīng)網(wǎng)絡(luò)占比超過98%的FSD,需要海量的高質(zhì)量、差異性數(shù)據(jù)來進化。

因此,在北美數(shù)據(jù)的“喂養(yǎng)”下,F(xiàn)SD測試版實現(xiàn)了非結(jié)構(gòu)化路段的部分自動駕駛能力,但特斯拉在中國還無法順暢跑通高速路段——目前缺乏使用中國場景數(shù)據(jù)的能力。

受國家數(shù)據(jù)安全要求,特斯拉在華數(shù)據(jù)不能“出國”,這不僅意味著數(shù)據(jù)本身要存儲在中國的服務(wù)器中,國外IP也不能通過網(wǎng)絡(luò)訪問,甚至在國內(nèi)讀取數(shù)據(jù)的人也有嚴格的國籍背景限制。

這意味著特斯拉要適配中國場景需要在中國“重建”組織。

首先是在中國的數(shù)據(jù)和研發(fā)中心。“負責(zé)數(shù)據(jù)采集和模型訓(xùn)練,以及產(chǎn)品經(jīng)理等一系列配套組織,百人以上的團隊。“一位新造車勢力的大數(shù)據(jù)工程師向《電動汽車觀察家》表示。

還需要重新構(gòu)建工作流程。因為美國的數(shù)據(jù)同樣不能進中國,所以只能從美國傳遞模型參數(shù),而不能傳遞數(shù)據(jù)本身,“這對模型的訓(xùn)練工作會帶來很大影響,需要重新在中國搭建訓(xùn)練用的pipeline(data pipeline:數(shù)據(jù)的采集、處理、脫敏、清洗、標注、分類和訓(xùn)練流程)。”上述大數(shù)據(jù)工程師表示,這又意味著數(shù)百甚至上千人的流程團隊。

《電動汽車觀察家》了解到,2021年下半年,特斯拉已經(jīng)開始在中國招聘自動駕駛研發(fā)的相關(guān)人員,但規(guī)模和用途仍不得而知。

而且,像所有跨國組織一樣,海外分支機構(gòu)從來不只是錢和人的問題。

“即使所有的研發(fā)導(dǎo)入,特斯拉中國和美國研發(fā)團隊的融合也不一定那么順利?!?Thoughtworks物聯(lián)網(wǎng)業(yè)務(wù)線總經(jīng)理朱晨向《電動汽車觀察家》表示:國際研發(fā)機構(gòu)最痛苦的地方在于分支機構(gòu)和總部的想法不一樣。例如中國的研發(fā)團隊根據(jù)中國國情做出一些特異化的判斷,提交到總部后是否愿意批準。“到底用誰的代碼,以及由此產(chǎn)生的一系列問題。小鵬則無需擔(dān)心這些問題?!?/span>

XPILOT誕生之初,便是為中國場景服務(wù)的。

小鵬采用以高精地圖為綱的決策邏輯,利用高精地圖和多傳感器融合,在感知和決策算法難度相對較低的情況下實現(xiàn)了高速導(dǎo)航領(lǐng)航這一L3級的高級別智能駕駛輔助能力的落地。

而且中國團隊還能夠針對本地場景進行專門的優(yōu)化,由此在體驗端超越了特斯拉NoA的在華表現(xiàn)。

據(jù)悉,小鵬對識別加塞、大貨車等“中國特色”場景都進行了感知方面的優(yōu)化:調(diào)整傳感器的布局和感知范圍;向XP的感知模型導(dǎo)入更多針對性場景進行訓(xùn)練。

針對高精地圖“鮮度”不夠的劣勢,小鵬進行了地圖系統(tǒng)的增強:對視覺感知到與高精地圖不符的新路況,建模補充進地圖;通過增強算法提升高精地圖的精確性,以更適應(yīng)道路起伏非常大的場景;通過技術(shù)將高精地圖未拍到的細節(jié)部補完等等。

值得注意的是,對高精地圖進行增強并不只是一個技術(shù)問題。

2021年,小鵬出資2.5億元收購江蘇智途科技有限公司,獲得了稀缺的甲級地圖資質(zhì)。不僅使“補完”地圖名正言順,而且還獲得了自建高精地圖的入場券。

小鵬也是首家取得該資質(zhì)的中國新造車勢力。

02

算法分歧

“每一次硬件的大幅改變,也會帶來軟件算法的大幅改變?!钡仄骄€創(chuàng)始人余凱在演講中表示。

感知硬件方案帶來的差異是小鵬與特斯拉現(xiàn)階段“分歧”的表象,更深層次的差異來自于不同感知路線背后“思維模式”的差別——在更遠的未來決定量產(chǎn)自動駕駛這一目標能否最終落地。

“思維模式”即自動駕駛系統(tǒng)的軟件算法。主要分為感知、決策和控制三部分。

  • 感知算法追求解決傳感器“感到”的東西是什么的問題,通過對感知到的物體進行分類、標注、理解,最終在車端建立起與現(xiàn)實路況高度相似的向量空間;

  • 決策算法則需要綜合考慮導(dǎo)航路線、道路情況、其他交通參與者的動作意圖,以及安全、效率、舒適等行駛標準,在向量空間中先求解出可行空間(凸空間),然后利用優(yōu)化的方法在可行空間內(nèi)優(yōu)化求解,輸出最終軌跡。

  • 控制部分則負責(zé)高效協(xié)同底盤系統(tǒng)的各個執(zhí)行件,以便忠實執(zhí)行決策算法的“決定”。

《電動汽車觀察家》解到,目前的高階駕駛輔助及自動駕駛系統(tǒng)當(dāng)中,感知算法絕大多數(shù)已采用AI神經(jīng)網(wǎng)絡(luò)進行感知,決策算法中也已在前端使用神經(jīng)網(wǎng)絡(luò)進行搜索和選項收斂,后端采用邏輯判斷的算法。

那么,在純視覺和多傳感器的硬件方案背后,軟件算法的分歧有多大?

2.1 | 感知算法對比

感知算法采用神經(jīng)網(wǎng)絡(luò)為主的AI模式已是當(dāng)下的主流模式。

時間回退至2020年8月,馬斯克首次表示特斯拉正在重寫FSD的基礎(chǔ)架構(gòu)。一年之后的AI DAY上,特斯拉宣布感知算法模型中CNN卷積神經(jīng)網(wǎng)絡(luò)的計算量占比達到了98%,并通過RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))加入了時間序列。通過利用具備出色算法并行性的Transformer融合不同攝像頭數(shù)據(jù)。

直觀來看,就是特斯拉車上8個攝像頭的原始數(shù)據(jù)進入感知算法模型,模型輸出時已是時空一致的結(jié)果。最近馬斯克表示,特斯拉已經(jīng)完成了從視覺到向量空間的完整映射。

目前公開的信息中,特斯拉的感知算法模型包含至少48個具體的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),可同時執(zhí)行超過1000個不同的識別、預(yù)測任務(wù),進行一次充分訓(xùn)練所需要的周期是7萬GPU小時。

相比之下,采用多傳感器融合的小鵬則要在完成視覺感知算法的基礎(chǔ)上,再走一步。

目前,小鵬P5搭載攝像頭、毫米波雷達、超聲波雷達、激光雷達和高精地圖構(gòu)成的傳感器方案。其中,雷達的感知算法相對簡單,高精地圖可提供超時空的先驗信息。

圖片

多傳感器數(shù)據(jù)融合過程 《中金 | AI十年展望》

真正的難度在于通過算法模型,將視覺、雷達和高精地圖的信息進行融合建立向量空間。

由于不同傳感器的探測頻率、信息類型和精度都各有不同,融合算法模型接收到的是時間不一致、信息不一致、甚至“樣子”都不一致的傳感器信息,要將其整合成為時空一致的向量空間,難度可想而知。

而且,相比于只靠“看”、信息一致的純視覺算法,多傳感器加高精地圖的方案還存在“信誰”這樣的選擇題——“置信”問題。

有專家向《電動汽車觀察家》表示,感知融合系統(tǒng)的“置信”問題,目前也主要依靠在仿真和真實路況中的第三方數(shù)據(jù)進行驗證。

小鵬處理的“置信”問題,不是一概而論的。在高速NGP階段,小鵬采用高精地圖為綱的策略,進入城市NGP階段,則將采用視覺感知為主的方案。

“在城市NGP中,高精地圖仍是非常重要的輸入。但是,由于激光雷達的存在和視覺感知能力的快速提升,我們對于各種場景能夠處理得更加安全和自然,在地圖的邊界或是數(shù)據(jù)出現(xiàn)錯漏的時候,能夠具備更強大的容錯能力。”吳新宙向《電動汽車觀察家》表示,“(隨著體系能力的建設(shè)),我們有信心趕上甚至超越特斯拉的視覺能力?!?/span>

2.2 | 純視覺的“易”與多傳感器融合的“難”

在視覺能力上追上特斯拉,從理論層面來看并不是一句大話。

基于圖像識別的視覺感知神經(jīng)網(wǎng)絡(luò)擁有“悠久”的歷史,也由此積累了眾多簡潔高效的開源算法。

這是特斯拉敢于公開其感知算法模型邏輯的原因所在,也成為小鵬要在視覺能力方面趕上,甚至超越特斯拉的基礎(chǔ)。

從目前的結(jié)果來看,XPILOT和FSD是目前量產(chǎn)自動駕駛系統(tǒng)中,唯二布局側(cè)方(A柱)視角攝像頭的車企。原因便在于,將側(cè)方圖像與廣角的前視攝像頭的圖像進行拼接融合的算法,有較高的門檻,尤其是在量產(chǎn)車型上。

做好視覺感知算法尤為重要。專家普遍認為,視覺感知仍將是未來自動駕駛系統(tǒng)的核心感知方案。

但為何還要做多傳感器融合路線?背后的核心是對反應(yīng)速度和安全冗余的極致追求。

隨著攝像頭能力不斷提升,視覺感知在應(yīng)對惡劣天氣和路況的能力方面不斷進步。但由于始終存在2D到3D的“翻譯”過程,以及由此帶來的1秒左右的延遲,這對行駛中的汽車來說,有時是致命的。

特斯拉目前已經(jīng)通過底層軟件改寫和系統(tǒng)整合,去掉了攝像頭為適應(yīng)人眼觀看而進行的圖像預(yù)處理(LSP)功能,直接將原始信息傳遞給模型,由此減少8個攝像頭共計13毫秒的延遲。

雷達則能直接給出距離/深度/速度信息,而且多傳感器的數(shù)據(jù)可以相互“查漏補缺”。

在P7上形成了自己的感知架構(gòu)之后,小鵬在P5上應(yīng)用激光雷達,又在G9上將此前的前視線三目攝像頭換成了雙目攝像頭——1個窄視+1個魚眼。

(隨著)XPILOT 4.0的能力更強,對攝像頭分辨率的要求也在提升,因此該攝像頭是在目前三目攝像頭分辨率無法滿足需求的背景下,實現(xiàn)更高分辨率的下一代產(chǎn)品。”吳新宙對此解釋道。

問題在于,目前“市面”上多傳感器融合的開源算法較少。

因此,走多傳感器融合路線,其融合算法將更依賴于各家自研、驗證和迭代,期間必將形成各自不同的風(fēng)格,但也缺少像視覺感知“全世界多領(lǐng)域一起加速”的優(yōu)勢。

而且,目前多傳感器融合路線將導(dǎo)致車企與供應(yīng)商強綁定。

與攝像頭擁有標準的數(shù)據(jù)格式和通用數(shù)據(jù)接口不同,雷達和高精地圖都還是“非標品”。激光雷達還存在機械、固態(tài)、半固態(tài)的路線之爭,數(shù)據(jù)格式和接口尚未形成業(yè)內(nèi)統(tǒng)一的標準。高精地圖也因各家圖商不同,在數(shù)據(jù)標定方式、精度等方面有所差異。

由此,盡管車企普遍追求軟硬解耦,但事實上在一些具有特殊性的傳感器領(lǐng)域,換供應(yīng)商便意味著對算法模型的改變。也導(dǎo)致多傳感器融合路線的車企在供應(yīng)商選擇方面更為謹慎,不僅建立采購關(guān)系,甚至不少還建立了投資、共同研發(fā)的深度合作關(guān)系。

2.3 | 更難的在于決策算法

解決“感到的是什么”,建立向量空間還只是開始。

AI技術(shù)在深度學(xué)習(xí)的加持下感知能力不斷增長,但仍欠缺“思考”能力:處理如條件概率、因果等復(fù)雜關(guān)系的能力,完成推理推斷的任務(wù)。

這樣的能力,在自動駕駛落地過程中,事關(guān)生死。

2018年,Uber的測試車輛出現(xiàn)了全球首例致死事故。美國官方報告顯示,車輛在事故發(fā)生前6秒觀察到了“障礙物”,在前1.3秒判斷出是自行車,需要采取緊急剎車。但“為了降低汽車發(fā)生不穩(wěn)定行為(舒適性不足)的可能性”,自動緊急剎車未啟動,而采取緩慢剎車,加之安全員走神,最終導(dǎo)致事故發(fā)生。

這一案例充分顯示了決策系統(tǒng)的重要性,尤其是在路況復(fù)雜,充滿了博弈場景的城市路況中。

通用旗下面向L4級的自動駕駛技術(shù)公司——Cruise,在去年的技術(shù)日上給出了好決策系統(tǒng)的定義:及時性;交互決策(對其他交通參與者與車輛未來行動及產(chǎn)生的影響進行考慮);可靠性和可重復(fù)性(能夠在相同場景做出相同的決策),由此輸出安全、高效,老司機般的乘坐體驗。

特斯拉在此前的AI DAY上明確了其決策系統(tǒng)的標準是安全、舒適、效率;

吳新宙向《電動汽車觀察家》介紹,XPILOT在難度更高的城市場景中的決策要素為:安全、可用性,以及好用性。

標準類似,但是要實現(xiàn)老司機般的操控表現(xiàn)卻非易事。

在低速或簡單場景下,決策算法會根據(jù)感知數(shù)據(jù)規(guī)劃出一條無碰撞的安全路徑,車輛按照指定路線運動。

但復(fù)雜的交通流和場景路況中,常會出現(xiàn)規(guī)劃軌跡跳變、碰撞等問題。核心是由于決策算法對障礙物未來行為的預(yù)見性不足,算法僅依靠當(dāng)前時刻的感知數(shù)據(jù)進行局部、而非全局路況求解導(dǎo)致。

因此,當(dāng)車輛處于陌生又復(fù)雜的場景中時,往往會反復(fù)緊急制動或出現(xiàn)危險動作,“安全、高效、舒適”的決策標準很難滿足。

車輛進行自動駕駛時,一般一個交通場景中可能有上百個交通參與者與自動駕駛車輛發(fā)生交互,決策系統(tǒng)需要考慮場景中其他交通參與者未來的動作,投影預(yù)測的社會車各種行為,行成一個可行駛空間,然后搜索出軌跡。

其中,預(yù)測被認為是自動駕駛系統(tǒng)工程落地中最困難的一環(huán)。車輛不僅要了解自身與環(huán)境未來可能的各種動向,還要從無數(shù)可能中判斷出最有可能的交通參與者行為。

為建立系統(tǒng)的預(yù)測能力,業(yè)內(nèi)目前除不斷地優(yōu)化算法之外,還需要對AI在世界模型中進行自我監(jiān)督學(xué)習(xí)。而特斯拉通過影子模式收集的、真實世界中海量的交通參與者行為,則成為FSD建立預(yù)測能力最好的教材。

去年的AI DAY上特斯拉展示過一個窄道會車的場景。自動駕駛車輛在開始時認為他車會繼續(xù)行駛,因此靠右等待,發(fā)現(xiàn)他車也停下讓行后,立刻前進了。

圖片

特斯拉自動駕駛車窄道通行案例,AI DAY

對此,一位自動駕駛規(guī)控工程師向《電動汽車觀察家》表示,目前大多數(shù)自動駕駛公司無法處理這樣的場景,往往會保守地選擇停車讓行,或與他車同起同停,造成碰撞風(fēng)險?!暗厮估梢院芎玫奶幚碓搱鼍?,證明它的預(yù)測和決策配合非常好?!?/span>

即使有了“預(yù)測”,“搜索”也不容易。

自動駕駛車輛通常需要采樣計算5000多條備選軌跡才能做出正確的決策。

但“時間不等車”,決策規(guī)劃算法通常運行頻率在10Hz-30Hz左右,即每30ms到100ms就需要計算一次,而在這么短的時間做出正確的決策是一個巨大的挑戰(zhàn)。

特斯拉FSD目可在1.5ms搜索2500次,通過對備選軌跡綜合評價后選擇最優(yōu)軌跡。

但這樣的做法在人車混流、道路結(jié)構(gòu)復(fù)雜的城市路況中往往會導(dǎo)致超算(超出計算平臺的算力能力)。

為此特斯拉引入了MCTS框架(蒙特卡羅樹搜索),相較傳統(tǒng)搜索方式效率提升了100倍以上。

MCTS可較為有效地解決一些探索空間巨大的問題,例如一般的圍棋算法都是基于MCTS實現(xiàn)的。蘋果自動駕駛專利和谷歌的阿爾法狗都有采用該方法。

圖片

小鵬XPILOT道路交互

目前,小鵬尚未透露其決策算法所利用的模型類型。不過吳新宙向《電動汽車觀察家》表示,在城市場景,由于交通參與者的不同和場景的復(fù)雜程度,對于預(yù)測、規(guī)劃和控制有完全不一樣的要求。所以,小鵬對定位、感知、融合能力是在高速場景的基礎(chǔ)上做了大幅增強。

對于決策部分,我們引入了一套全新的架構(gòu),來滿足城市NGP更高的要求。這部分架構(gòu)也有非常強的反向兼容性,所以我們也期待未來在XPILOT 3.5上,我們的高速和停車場場景也能受益于這套新的架構(gòu),給用戶更好的體驗。

03

小鵬如何在全球追趕特斯拉

特斯拉FSD早晚在中國開放,而小鵬汽車智能駕駛也要走出中國。兩方早晚正面對戰(zhàn)。小鵬能否在東半球,乃至全球和特斯拉一戰(zhàn)?

真正給何小鵬叫板特斯拉信心的,是小鵬汽車從2020年完成的端到端全棧自研體系能力。

3.1 | 打造自己的算法數(shù)據(jù)閉環(huán)

何為全棧自研?

吳新宙向《電動汽車觀察家》表示:小鵬汽車的“全棧自研”不僅是自研車端的視覺感知、傳感器融合、定位、規(guī)劃、決策、控制等方面(的算法)。

還包括云端數(shù)據(jù)運營所需的一系列工具和流程。

即數(shù)據(jù)上傳通道、前端數(shù)據(jù)上傳實現(xiàn)、云端數(shù)據(jù)管理系統(tǒng)、分布式網(wǎng)絡(luò)訓(xùn)練、數(shù)據(jù)采集工具開發(fā)、數(shù)據(jù)標注工具開發(fā)、軟件部署等方面實現(xiàn)自研。

“由此形成數(shù)據(jù)和算法的全閉環(huán),為快速的功能迭代打下堅實的技術(shù)基礎(chǔ)?!?/span>

區(qū)別于邏輯判斷算法模型依賴于工程師有多聰明,自動駕駛系統(tǒng)主要采用的神經(jīng)網(wǎng)絡(luò)算法模式具有“基于數(shù)據(jù)成長”的特性:算法是在前期數(shù)據(jù)收集、中間數(shù)據(jù)存儲與遷移,后期核心數(shù)據(jù)的訓(xùn)練與管理,所形成的數(shù)據(jù)流中逐漸成熟的。

算法由數(shù)據(jù)推動迭代,迭代算法又帶來新的數(shù)據(jù),系統(tǒng)能力的提升本質(zhì)上是在數(shù)據(jù)中循環(huán)往復(fù)的過程。

在這一成長閉環(huán)當(dāng)中,任何一個環(huán)節(jié)加以他人之手,都將影響企業(yè)“自己的”自動駕駛系統(tǒng)迭代升級的速度和質(zhì)量。

此前傳統(tǒng)汽車產(chǎn)業(yè)中是沒有“自己的”節(jié)奏的。主機廠雖然占據(jù)產(chǎn)業(yè)鏈的強勢位置,但車型迭代周期更多受限于零部件供應(yīng)商技術(shù)和商業(yè)的節(jié)奏。直到特斯拉打破了這一行業(yè)慣例。

圖片

特斯拉AP更迭歷史 資料整理:《電動汽車觀察家》

2016年6月發(fā)生的Model S死亡事故中,何時通過視覺方案實現(xiàn)AEB(緊急制動)的時間分歧導(dǎo)致了特斯拉與Mobileye徹底“分手”。

對于事故車輛沒有啟動緊急制動(AEB)功能,Mobileye首席通信官DanGalves發(fā)表聲明稱:“目前(2016年)AEB被歸入躲避追尾事故系統(tǒng),(因而無法應(yīng)對前方橫向出現(xiàn)的車輛)。不過Mobileye將會從2018年開始帶來道路側(cè)向轉(zhuǎn)彎(LTAP)檢測功能?!?/span>

但特斯拉即不愿意等到2018年,也不愿意走Mobileye所擅長的傳統(tǒng)視覺感知路線。

于是,才剛成立一年的特斯拉視覺感知自研軟件算法小組Autopilot Vision(TV)和機器學(xué)習(xí)小組,在2016年10月“強行”頂替了Mobileye的位置,并在年底確定了AI視覺感知的技術(shù)路線。

上線之初,TV并未完成AP軟件端所有的應(yīng)用開發(fā),包括 AEB、防碰撞預(yù)警、車道保持、自適應(yīng)巡航等關(guān)鍵功能缺失數(shù)月之久,還用毫米波雷達干了一段時間AEB的“活兒”,導(dǎo)致眾多“幽靈剎車”的案例產(chǎn)生。

直到2017年4月,特斯拉推送V8.1,自研的AI視覺算法能力追上了Mobileye為支撐的HW1.0時代,就此開啟了汽車產(chǎn)業(yè)從未有過的迭代速度,并“逼迫”全行業(yè)“追趕”起了特斯拉的節(jié)奏。

小鵬是全行業(yè)第一個從全棧自研,而非僅僅是功能層面,追趕特斯拉節(jié)奏的車企。

2018年,通過小鵬G3,XPILOT 2.0 正式產(chǎn)品化落地,實現(xiàn)了端到端自研數(shù)據(jù)閉環(huán)的自動泊車系統(tǒng)量產(chǎn);

2019年在小鵬G3i上搭載的XPILOT 2.5 系統(tǒng)在泊車之外,實現(xiàn)了ALC自動變道功能。其中,小鵬自主研發(fā)了最底層的線控、路徑規(guī)劃和控制部分算法,感知算法仍依賴于供應(yīng)商提供;

2020年,小鵬P7和XPILOT 3.0一同亮相,可實現(xiàn)NGP和停車場記憶泊車功能,至此小鵬第一次完成了深度的軟件全棧自研,建立了自己的視覺感知能力、驅(qū)動感知進化的數(shù)據(jù)閉環(huán)體系、高階輔助駕駛算法和軟件架構(gòu)的落地,成為全球第二家實現(xiàn)自動駕駛系統(tǒng)全棧自研,算法、數(shù)據(jù)閉環(huán)的車企。

與非自研相比,采用‘全棧自研’模式在組織、人才、研發(fā)投入上肯定都更重,但是優(yōu)勢也是顯而易見的?!眳切轮姹硎?。

3.2 | 掘金全棧自研

優(yōu)勢確實顯而易見。

僅從高速導(dǎo)航領(lǐng)航功能來看,小鵬NGP于2020年落地;蔚來雖然略早幾個月,但仍是基于Mobileye半自研產(chǎn)品;理想則在2021年9月升級后才將該功能落地。

而包括極氪+Mobileye(ZAD)、極狐華為HI 版(華為 ADS)、智己汽車+Momenta(IM AD)、哪吒汽車(華為+地平線)、零跑汽車(Leap Pilot)等品牌雖然都有L3級高階智能駕駛能力的計劃,但仍與小鵬存在相當(dāng)?shù)臅r間差。

跟“自己比”,小鵬也進步迅速。

圖片

小鵬XPILOT系統(tǒng)更迭情況 資料整理:《電動汽車觀察家》

2020年,小鵬P7在自研方案之外,還采用了1個前置攝像頭和一個英飛凌Aurix MCU 2.0為主的智能控制器作為冗余方案,其感知和決策算法也來自博世。到2021年的P5身上,這套來自第三方的冗余方案被取消了,P5只了搭載英偉達Xavie平臺,而且增加了激光雷達作為傳感器。

按照計劃,小鵬將在算力為30TOPS的英偉達Xavie平臺上實現(xiàn)XP3.5最核心的城市NGP功能。同樣實現(xiàn)這一高階駕駛輔助功能的特斯拉FSD芯片算力則為144TOPS。

“(全棧自研)鍛煉了團隊的極致工程能力,在有限的算力下實現(xiàn)了相對復(fù)雜的功能落地?!眳切轮嫦颉峨妱悠囉^察家》表示:“從XPILOT 3.0到3.5,再到未來的4.0和5.0,小鵬的技術(shù)路線是非常有延續(xù)性的自然演進?!?/span>

3.3 | 效率競爭

殊途同歸。小鵬雖然已經(jīng)走上了與特斯拉頗有分歧的技術(shù)路線,但兩者的路徑和目標卻是一致的:通過全棧自研,實現(xiàn)量產(chǎn)自動駕駛技術(shù)。

在吳新宙看來,面向這一目標的較量其一在于數(shù)據(jù)量,其二則在于正確的網(wǎng)絡(luò)架構(gòu)。

“特斯拉目前的網(wǎng)絡(luò)架構(gòu),對于體系能力有很高的要求,無論從數(shù)據(jù)的獲取,標注和訓(xùn)練來看,其它廠家在體系能力的建設(shè)和投入上和特斯拉有巨大的差距?!?/span>

數(shù)據(jù)量方面,特斯拉目前在全球范圍內(nèi)無人能敵。

特斯拉人工智能總監(jiān)Andrej在CVPR(IEEE國際計算機視覺與模式識別會議)2021上表示,截至2021年6月底,特斯拉擁有百萬量級的車隊,已經(jīng)收集了100萬個36幀10秒時長的高度差異化場景視頻數(shù)據(jù),約占用了1.5PB的存儲空間。獲得了60億個包含精確深度、加速度的物體標注,共進行七輪影子模式迭代流程。

這一數(shù)據(jù)規(guī)模,不僅小鵬與特斯拉相去甚遠,即使是一眾自動駕駛公司也難望其項背。去年10月,Waymo公布的最新數(shù)據(jù)中,累計路測里程達到1000萬英里。特斯拉截至去年6月的數(shù)據(jù)則為近1500萬英里,其中170萬英里在Autopilot啟動情況下收集。

數(shù)據(jù)是自動駕駛系統(tǒng)算法模型迭代成長的燃料。而特斯拉已建造了一套高效的數(shù)據(jù)閉環(huán)體系,將這些海量數(shù)據(jù)加工成“無煙煤”。

圖片

特斯拉數(shù)據(jù)生產(chǎn)的三個階段 《中金 | AI十年展望》

在百萬輛級的車隊基礎(chǔ)上,特斯拉通過“影子模式”有針對性地搜集海量corner case(罕見特殊的長尾場景)場景數(shù)據(jù),以及人類司機在該場景下的操作數(shù)據(jù)為神經(jīng)網(wǎng)絡(luò)提供質(zhì)量更高的半監(jiān)督學(xué)習(xí)或監(jiān)督學(xué)習(xí)引導(dǎo);

這些原數(shù)據(jù)需要被標記出各類特征之后,才能作為神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)素材。

此前,這類非結(jié)構(gòu)化數(shù)據(jù)依賴大量人工標注,屬于勞動密集型產(chǎn)業(yè),各企業(yè)多將工作外包給第三方。但第三方標注具有效率低、反饋慢等痛點,導(dǎo)致標記、分析、處理訓(xùn)練數(shù)據(jù)的延遲較高。

特斯拉自建超過一千人的數(shù)據(jù)標注團隊,分成人工數(shù)據(jù)標注、自動數(shù)據(jù)標注、模擬仿真、數(shù)據(jù)規(guī)?;膫€團隊,技術(shù)層面已經(jīng)完成了從2D標注到4D標注和自動標注的進階,自動標注工具可以通過一次標注就實現(xiàn)所有攝像頭多視角、多幀畫面同步標注,同時也能就時間維度進行標注。

自建數(shù)據(jù)標注體系之后,特斯拉還自建了數(shù)據(jù)的訓(xùn)練場——由3000個特斯拉自研Dojo D1芯片組成的算力高達1.1EFLOP的超算集群,與與谷歌(1 EFLOP)和商湯(1.1 EFLOPS)同為當(dāng)下世界第一的算力梯隊。

而且相比谷歌、商湯的通用性超算集群,Dojo在設(shè)計上更專注于視頻處理,對特斯拉自動駕駛系統(tǒng)模型訓(xùn)練更具有針對性,并由此有效降低算法成本。

我們認為,體系的差距比數(shù)據(jù)的差距更重要,小鵬過去幾年一直致力于自己的體系能力建設(shè)。復(fù)雜系統(tǒng)工程在終端呈現(xiàn)的結(jié)果也并不是單一變量決定的,還是要看整體設(shè)計與硬件匹配的程度。

后續(xù),我們也會持續(xù)在算法優(yōu)化和傳感器選型或者變更上做好平衡,用合適的硬件做出更高階的輔助駕駛能力,并持續(xù)向自動駕駛演進。”吳新宙向《電動汽車觀察家》表示。

3.4 | 小鵬的機會點

效率和成本,是任何產(chǎn)品能夠成功實現(xiàn)大規(guī)模量產(chǎn)的決定性因素。而特斯拉建設(shè)這套增效降本的數(shù)據(jù)閉環(huán)體系不僅依仗自身的技術(shù)能力,而且也與其強大的資金實力息息相關(guān)。

2021年,特斯拉的研發(fā)費用約為168億元(25.91億美元,6.5人民幣/美元)。相比之下,小鵬為41.14億元,長城為90.7億元。

但這并不意味著小鵬在與特斯拉量產(chǎn)自動駕駛的下半場競賽中全無勝算。

朱晨向《電動汽車觀察家》表示,相比于特斯拉完全從技術(shù)公司的角度出發(fā)的產(chǎn)品思路,小鵬在推出產(chǎn)品功能時候,更多思考的是能否結(jié)合中國的適用場景,真正給車主的生活帶來幫助。

而更適合中國用戶需求的功能則有助于小鵬在中國銷量的規(guī)?;瑥亩鴮崿F(xiàn)真正意義上,XPILOT的量產(chǎn)落地,并幫助其建立起中國場景下的數(shù)據(jù)及體系優(yōu)勢。

2020年,F(xiàn)SD(特斯拉完全自動駕駛系統(tǒng))在華購買率只有1-2%,低于北美10%-15%的比例(外媒測算)。2021年Q4,Model 3車型上的FSD搭載率,在亞太地區(qū)為0.9%,歐洲和北美則分別為21.4%和24.2%。(長期關(guān)注特斯拉的博主Troy Teslike統(tǒng)計數(shù)據(jù))

圖片

小鵬XPILOT落地情況,2021年Q3

截至去年三季度末, 與特斯拉Autopilot 加強版功能相似的XPILOT 3.0激活率近60%。吳新宙未透露小鵬的數(shù)據(jù)獲取模式,但表示“世界的先進經(jīng)驗都會學(xué)習(xí)。”

在算力和道場方面,小鵬目前可借助的“外力”絲毫不弱。

小鵬G9將搭載XPILOT 4.0,其上應(yīng)用508 TOPS的 英偉達 Orin-X芯片,和千兆以太的高度集成域控制器。而且英偉達今年發(fā)布的AI訓(xùn)練服務(wù)器EOS算力高達18.4 EFLOPS。

而且小鵬相較于特斯拉對場景的把握能力已經(jīng)開始顯現(xiàn)。

今年3月,小鵬汽車推送了Xmart OS 3.1.0版本,實現(xiàn)了長達2公里的VPA-L跨樓層停車場記憶泊車功能。幾乎是同期,坊間傳言特斯拉正在研制“Smart Park”:在有司機的前提下,車輛自動停在“最接近門邊”、“在購物車出口附近”、“停車場末端”等指定位置。從功能描述上,Smart Park與記憶泊車非常類似,領(lǐng)跑者與追趕者位置倒置。

在更遠的海外,正如何小鵬此前所說:“我們會相遇的?!?/span>


本文鳴謝(首字母排序)

阿寶1900  自動駕駛專家

迪迪自動駕駛數(shù)據(jù)工程師

吳新宙 小鵬汽車自動駕駛副總裁

自動駕駛拖拉機 決策規(guī)劃算法工程師

朱晨Thoughtworks物聯(lián)網(wǎng)業(yè)務(wù)線總經(jīng)理

參考資料:中金《軟件及服務(wù) | 人工智能十年展望》

——END——

來源:第一電動網(wǎng)

作者:電動汽車觀察家

本文地址:http://www.healthsupplement-reviews.com/kol/174652

返回第一電動網(wǎng)首頁 >

收藏
70
  • 分享到:
發(fā)表評論
新聞推薦
大牛作者

電動汽車觀察家

《電動汽車觀察家》持續(xù)提供新能源汽車的真實信息和誠懇意見 微信訂閱號搜索:evobserver

  • 1142
    文章
  • 63847
    獲贊
閱讀更多文章
第一電動網(wǎng)官方微信

反饋和建議 在線回復(fù)

您的詢價信息
已經(jīng)成功提交我們稍后會聯(lián)系您進行報價!

第一電動網(wǎng)
Hello world!
-->