它太新,也太“重”了。
“對,”陳默點頭。
“它不關心前方障礙物是車、是人、是錐桶還是別的什么具體類別。
它只關心一個最本質的問題:車輛前方及周圍的三維空間里,哪些體素(voxel)被占用了?
是剛性占用(如墻壁)還是柔性占用(如灌木叢)?
是可穿越的還是不可穿越的?”
他一邊說,一邊拿起桌上的白板筆,轉身在旁邊的白板上快速勾勒起來。
寥寥幾筆,畫出一個粗糙的車輛前方視角,然后打上密集的三維網格。
“輸入多視角攝像頭圖像,甚至融合低線束激光雷達的稀疏點云,通過一個精心設計的3d卷積神經網絡,直接輸出一個稠密的三維占用柵格圖。
每一個小格子(體素)都有一個概率值,表示它被占據的可能性。
同時,還可以預測每個被占據體素的運動狀態(速度向量)。”
陳默的筆尖在網格上移動:
“這樣,無論前方是一個標準車輛,還是一堆怪異的建筑垃圾,甚至是一團濃霧(如果能部分穿透),系統都能感知到‘有東西占著這個空間,可能會動’。
避障是最核心的需求,知道‘有東西’且‘它怎么動’,往往比精確知道‘它是什么’更重要,尤其是在極端ercase下。
而且,這種表達天然適合后續的軌跡規劃和碰撞檢測,因為它直接描述了空間的占用情況。”
他放下筆,看向已經完全被吸引的李鵬飛和卞金麟:
“這或許能繞過傳統目標檢測對長尾類別識別的依賴,提升對異形障礙物的泛化能力。
當然,計算量巨大是現實挑戰,需要算法創新和硬件加速的協同。
但方向,我認為值得探索。
鵬飛,你在諾基亞搞高精地圖和sla,對空間建模理解很深,怎么看?”
李鵬飛深吸一口氣,眼中閃爍著震撼和興奮的光芒,仿佛被一道閃電劈開了思維的迷霧。
他緊緊盯著白板上那個簡陋的網格圖,大腦以前所未有的速度運轉起來。
忽略物體類別,直指空間占用的本質。
這思路太顛覆了!簡直是給感知領域開了另一扇窗。
他之前的研究一直糾結于如何提升目標檢測的精度和魯棒性,卻從未想過可以換個角度,直接描述空間的“滿”與“空”、“動”與“靜”!
“陳總...您這想法...”李鵬飛的聲音因為激動而微微發顫。
“太...太有啟發性了!
它跳出了物體識別的框架,直指自動駕駛最核心的空間安全性問題!
對!異形障礙物、未知物體...
這些困擾業界多年的難題,在占用網絡的框架下,可能被極大緩解。
計算量確實是座大山,但稀疏卷積、模型蒸餾、專用硬件...
這些都是可以攻克的路徑!
我...我立刻組織感知團隊進行預研和可行性驗證。
這可能是解決bev落地痛點的關鍵鑰匙!”</p>