李飛鵬幾乎要拍案而起,看向陳默的眼神充滿了不可思議的欽佩。
這位年輕的技術副總裁,腦子里裝的到底是什么?
竟對技術本質的洞察竟如此深刻!
陳默微微一笑,目光轉向負責規劃與決策的陳奇驚:
“第二點,關于規劃和alc的決策猶豫問題。
奇驚,你從特斯拉帶來的pdp(預測-決策-規劃)框架是基礎,但特斯拉ap在變道時有時顯得過于激進甚至魯莽,有時又過于保守。
核心可能在于,它的預測、決策、規劃是相對割裂的模塊。”
陳奇驚神色一凜,專注地看著陳默。
他在特斯拉auilot團隊的經歷讓他深知模塊化設計的優勢與局限。
“我在想,”陳默的手指在白板上虛劃,將之前代表“預測”和“規劃”的區域猛地圈在一起。
“是否可以嘗試一種更緊密耦合的思路——時空聯合規劃(spatio-teporaljotpnng)?
將自車的軌跡規劃與對周圍交通參與者(targetvehicles,tvs)未來行為的預測,放在一個統一的、基于優化的框架下進行聯合求解?”
“統一的框架?”陳奇驚眉頭緊鎖,陷入深思。
這個概念對他而言同樣極具沖擊力。
“對,”陳默點了點頭。
“簡單說,規劃器不再僅僅優化自車一條最優軌跡,而是同時考慮周圍關鍵車輛可能的多種行為假設(比如加速、減速、保持、變道),并為每一種行為假設賦予一個概率。
然后,在優化目標函數里,不僅要包含自車的舒適性、效率、安全性,還要顯式地包含與這些假設軌跡的交互成本(如避免碰撞的風險、變道切入時對后車的影響)。”
他頓了頓,讓眾人消化:
“這樣,規劃器輸出的不僅僅是一條軌跡,而是一系列‘條件軌跡’。
如果a車加速,我這樣走;
如果a車減速,我那樣走;
如果b車突然變道,我又該如何應對。
決策(decision)被隱含在了軌跡的生成過程中,而不是作為一個獨立的、非此即彼的(變道\/不變道)模塊前置。
最終執行哪條軌跡,可以基于實時的感知預測更新,選擇風險最低或綜合收益最高的那條。
這或許能解決當前alc在車流復雜時‘不敢變’或‘硬變’的尷尬,讓變道行為更流暢、更擬人化,也更安全。”
“臥槽!”
陳奇驚沒忍住當著徐總和姚總的面高呼了一聲臥槽,但他渾然不覺。
只是死死盯著陳默,臉上充滿了震驚和豁然開朗的表情。
時空聯合規劃,將預測的不確定性和規劃的靈活性統一在一個優化框架內!
這思路...
這思路他媽的簡直是給自動駕駛的決策規劃領域投下了一顆核彈。
完美地擊中了模塊化pdp框架在復雜交互場景下決策猶豫或魯莽的痛點!
他在特斯拉時,團隊內部也曾討論過類似模糊的想法,但從未有人能像陳默這樣,清晰、系統、一針見血地提出可行的理論框架。