极品白丝-激性欧美激情在线播放16页-激情综合五月天丁香婷婷-激情伊人网-亚洲天堂久久精品成人-亚洲天堂久久精品

極越賈秀江:每周花兩、三千萬,訓練純視覺方案

極越賈秀江-圖1

在2024北京國際車展上,極越宣布將與NVIDIA協作打造下一代智能汽車,從2026年開始,極越量產的車型將搭載NVIDIA的新一代集中式車載計算平臺NVIDIA DRIVE™ Thor。車展期間,極越整車產品負責人賈秀江做客網上車市&智電出行&騰訊汽車聯合專訪間。

對于極越采用的純視覺方案,賈秀江表示:我們現在基本上每周迭代一次、訓練一次2000萬元-3000萬元,這個由我們承擔,老百姓得實惠了。

 

以下是采訪實錄:

網上車市&智電出行:極越把自己的產品定義為智能汽車機器人,這個很好玩,你不把它定義成一臺車了,它只是一臺車形狀的機器人,您怎么看這件事情?

賈秀江:前一段時間很多人問我,你們這是不是一個噱頭,是不是想做一個宣傳。在此,我要聲明,絕不是噱頭。我們初心就是想做一個類似機器人的高度智能化產品,比如純視覺方案。其實純視覺也好,語音交互也好,背后的所有基礎和核心都是AI的能力。AI的能力里面最核心的又是對圖像的識別、感知和理解,對于語音的感知、識別和理解,這些如果相通了以后,做一個車也好,或者是做一個兩足機器人也好,人形機器人也好,其實是類似的。

我們內部有一句話說,我們是一家以AI驅動的科技公司,汽車是我們的產品之一,這是我們的初心,也是宏大的夢想。本質上,車高度智能化以后必然會越來越像一個機器人。

極越賈秀江-圖2

網上車市&智電出行:現在主流的智駕方案都是配備兩、三個激光雷達,成本很高,很多消費者對于純視覺一直抱有一個存疑的態度。比如說特殊天氣,大霧、大雪,或者是高光比等等,極越在這方面會有什么特別的優勢嗎?

賈秀江:純視覺方案目前在市場上是少數派,但是從長遠來看我們認為這是一個最好的方案,我把這個總結為“兩大、一高、得實惠”。

什么叫“兩大”?第一信息量大。比如說我們隨便拿一個攝像頭來比,前面有800萬的高清攝像頭,首先這些攝像頭跟人眼比,它的像素非常高,跟激光雷達比,它的信息量如果按照現在常規的128線的激光雷達比,它能獲取的信息量是相差了160倍,它更多。因為128個點在掃描,它的信息量跟800萬的沒法比,這是第一點。

另外,我們車的周圍裝了11個攝像頭,一般的激光雷達是沒法比的,密度也很高。信息量大了以后有很多好處,比如說不僅可以獲得障礙物的邊界信息,還能知道障礙物的紋理和障礙物的顏色。舉個例子,現在我們的1.4版本就可以純視覺方案區分出來這個障礙物是植物還是建筑物。到我們的車上可以看到SR的顯示量非常大,有幾個場景。

比如說現在要倒車,周圍如果是一些樹枝、樹葉,車輛就會說這些東西稍微擦碰一下沒有關系,你可以慢慢靠近。如果你說邊界是建筑肯定不能靠近,激光雷達就做不到。

網上車市&智電出行:對它來說都是物體。

賈秀江:對,都不能碰。植物其實可以碰,還有我舉個例子,北京有很多柳樹,柳樹不是掛下來嗎?如果是激光雷達,很可能就誤判這個東西是一個墻,我們就可以判斷這是植物,有幾個好處,我們可以慢慢開過去。目前是剛剛開始,激光雷達只能夠判斷出來物體的狀態,我舉個例子,一個行人拎著一個行李箱在路上走,激光雷達掃描的是當時一刻,你很難感知到這個行李箱和這個人是什么樣的位置,是什么樣的從屬關系。圖像識別就可以,我們的BEV和transformer和OCC結合有一個記憶的功能。它就知道這個箱子會隨著人走,如果激光雷達只知道這兩個之間的相對位置關系,但是不知道會不會同時運動,你有了這個信息之后就可以提前預判說接下來箱子和人會到什么階段?諸如此類,信息量大就特別好。因為你就看得更清楚。

極越賈秀江-圖3

網上車市&智電出行:這個對算法不是很高的考驗嗎?

賈秀江:說得非常好,第二個大就是算力非常大。首先我們車內的算力值是508TOPS,因為信息量大,對于云端訓練的要求就特別高。我們目前正式對外公布,當然還要依靠百度集團的支持,百度云計算平臺給我們目前是2.2EFLOPS,相當于220億億次浮點運算。這個有點難理解,我們如果拿最新的蘋果手機算力來看,大概是15萬臺手機的算力同時運算才能夠訓練一次。

同時依靠百度集團對我們的算力支持上不封頂。最近也有幾個友商宣布了多少算力,我們可以看一下目前我們剛起步的算力就是很多人的天花板。所以第一個是我們信息量大,第二是算力要大。還有“一高”就是精度高,很多人可能就會以為說你的純視覺,如果遇到下雨天各種各樣的天氣、精度是什么樣的,我先講一下,現在純視覺精度能做到什么程度?

對于障礙物大小識別可以精確到厘米級,像礦泉水這樣基本上就可以識別了。

網上車市&智電出行:怎么預判距離的識別?

賈秀江:我們有雙目攝像頭。

網上車市&智電出行:交叉?

賈秀江:對。交叉結合整個運動的軌跡,還有一個是運動速度的精度,剛才說是物體大小的精度。物體運動速度精度可以達到分米級每秒,這個就特別有用。我舉個例子,像匯入路口的正常行駛,別人要插進來,這個時候它速度是不快的。你要能夠非常清楚判斷它動了還是沒動,如果判斷錯了就撞上了。所以這兩個精度一個是厘米級障礙物大小的分辨精度,一個是分米級每秒的運動速度精度。這3個是我們所謂的純視覺技術上的優勢。

還有一個說老百姓得實惠。第一,硬件拿掉了,一些友商用了3個激光雷達,這都省掉了。第二,激光雷達是有運動部件的,保養、壽命各方面。

網上車市&智電出行:顛簸對它都是損傷。

賈秀江:還有轉動,這些東西老百姓得實惠了。但是我們付出了很高研發的代價。我們現在基本上每周迭代一次、訓練一次2000萬元-3000萬元,這個就是我們承擔了。

我們為什么這么做?本質上是希望能夠讓這個方案盡快普及,讓老百姓們盡快用得到。因為純視覺方案還有一個巨大的好處,除了前面那些以外,隱藏的好處就是它的信息源只有圖像和視頻,這樣用大模型訓練的時候迭代速度就快了。如果我用激光雷達的數據過來,就是兩個模型同時訓練,算力有限的情況下速度就慢了。

極越賈秀江-圖4

網上車市&智電出行:優先級問題等等,好多數據。

賈秀江:對。所以從這些考慮你可以看到,我們純視覺方案切換也只有一年多。我們在上市前大半年都有激光雷達,在上市前我們就下定決心拿掉了。但是你看我們這個體驗,每個月的版本都提升得非常明顯,根本原因就是剛才說的幾點,信息量大,算力大了以后迭代速度快。精度又比較高,老百姓得實惠了。

網上車市&智電出行:我們累計的優勢會越來越大,呈指數級。別人還在激光雷達限制范圍內的時候我們已經跳脫出了一個新的賽道。

賈秀江:我們經常拿激光雷達做一個比喻,激光雷達像一個拐杖,你剛剛開始蹣跚學步的時候,它比較快,走得比較快。但是你要跑起來,這個拐杖就礙事了。

網上車市&智電出行:治標不治本。

賈秀江:對。所以我們雖然起步初速度慢了一點,但是加速度很快。不久前有一個智駕的比賽,在北京我們又拿第一了,隨著全國都能開,這個事件就能夠快速落地,我們在這個行業會有一席地位。

網上車市&智電出行:再跟我們說說剛亮相的極越07。這個車有哪些亮點?

賈秀江:我把07歸納為3個關鍵詞,第一是最美,二是智能,三是掀背,最美就比較好理解了。我們為了好看做了很多的細節,這些好看不僅是設計的,其實背后是強大的智能化能力的支持,比如說我們的攝像頭,我們的激光雷達,原來最初都是有激光雷達的。激光雷達拿掉,激光雷達有時候會長犄角,攝像頭有時候會長犄角,有些廠商就會長犄角,我們就把它藏起來了,藏起來非常難,又好看,風阻又小。

我再舉個例子,極越全系列都有車外語音交互功能,但是其實很少人發現得了收音部件在哪里。

我們車外有4對,8個麥克風都藏起來了,這些東西為了好看真的很難設計。還有我們要做環視的攝像頭,你是看不到攝像頭在哪的。它的很多圖像轉換跟處理真的是智能化到了一定階段才能做得到。兩個細節,比如說攝像頭,有些廠家圖象處理能力不行,攝像頭就必須安裝在一定固定的位置,變成像雞眼,就不好看了。功能是好用,但就是不好看,這個就很難。還有一個超聲波雷達,一般是前6后6,超聲波雷達最好的角度是跟車輛平行的,垂直地面的。但是它跟車的周圍不一定那么垂,所以很多時候你會看到很多廠商的超聲波雷達摸上去都是凸出來的,極越是純平的。這就會導致這個面是斜的,在斜的情況下要能夠明確感知周圍的距離,這個很難。

我們為了好看,左輪圈跟右輪圈都是對稱的,比如說這邊是車頭,轉的時候有一個風火輪的造型,這樣一直都是順時針。如果轉到那邊雖然也是順時針,但是就不好看。車輪在這邊是這么轉,到那邊應該是那么轉的。所以為了好看,我們的輪圈都是對稱的,重新做了一套,真的是為了好看下了很大功夫。

這些東西,包括門上的毫米波雷達,我們也可以用超聲波,超聲波十幾塊、二十塊,毫米波三、四百,我們有4個。好看付出了很大的代價。智駕和語音,我就不贅述了。我特別講一點它的掀背,當時我們做這個功能爭議非常大,因為掀背很難做,在大空間的基礎上,整個車身還要滿足它的碰撞。碰撞還有一些結構性要加強,必然要帶來很多成本和代價,工程上要重新做。但是我們想到開這個車的年輕人,喜歡去露營,如果后備箱打開二排座椅不能放倒,像普通三廂轎車一樣,沒法在里面休息,后來我們決心還是做了,而且這個溜背特別好看,這是我們的一大賣點。這個市場上別人就沒有掀背的,類似的真的沒有。

大部分做的像特斯拉,還有一些友商,大部分都是傳統三廂轎車,實用性就不如掀背。

主要是這3點。

網上車市&智電出行:極越這個車玩的屬性比較重,重度科技玩家比較嘗鮮的一款產品。

賈秀江:我們的想法是這樣的,新時代車內的沙發、彩電大家都做過了,我們覺得能夠有創新的,主要集中在幾個地方。第一是智駕,第二是語音交互,在這個情況下如果自動駕駛能力很強,人們必然對娛樂和其他跟非駕駛相關的東西感興趣。比如說我車開著,想看看片,多聽聽音樂,哪怕休息的時候玩個小游戲。

我舉個場景,假如說帶個妹子看日出,我在山里露營,開個篝火,首先露營你這個車得有露營模式,你得是掀背,得躺得下,車外還有一個揚聲器可以放音樂。三、五好友圍著篝火,夜晚看星星,看月亮,車外可以跟語音說,SIMO,幫我們換一首周杰倫的歌,它就幫你做了。這個場面想想就特別的吸引人。

網友還看了

最熱評論

全部評論

意見
反饋