開放空間決策規(guī)劃技術(shù):如何像人類司機(jī)一樣流暢駕駛?
開放空間決策規(guī)劃技術(shù):如何像人類司機(jī)一樣流暢駕駛?
經(jīng)過多年的發(fā)展,移動機(jī)器人領(lǐng)域基本沿襲了“感知-決策規(guī)劃-控制”的經(jīng)典框架。這套架構(gòu)解決了許多工程問題,也在算法、軟件、硬件等各個(gè)層面,對一個(gè)復(fù)雜的系統(tǒng)進(jìn)行了有效的切分。
對于智能駕駛系統(tǒng)來說也是如此:在沒有智能駕駛輔助的情況下,人類駕駛員通過雙眼感知世界,根據(jù)經(jīng)驗(yàn)和意識思考下一步行動,然后通過控制方向盤和油門踏板,把車輛開到想去的地方。智能駕駛系統(tǒng)正是要在這個(gè)過程中,逐步的幫助人類簡化操作和思考,為人類駕駛員降低駕駛負(fù)擔(dān),減少疲勞。

在智能駕駛系統(tǒng)中,決策規(guī)劃的作用相當(dāng)于人類大腦
為了應(yīng)對不同的智能駕駛需求,決策規(guī)劃技術(shù)產(chǎn)生出了各類方法:從經(jīng)典的采樣、搜索、優(yōu)化,到神經(jīng)網(wǎng)絡(luò)甚至端到端。其實(shí)無論采用哪種技術(shù)方案,目的都是為了提升智能駕駛產(chǎn)品的最終效果與用戶體驗(yàn)。那么,決策規(guī)劃需要提供什么樣的能力,才能夠讓智能駕駛體驗(yàn)更符合人類的預(yù)期?
將這個(gè)抽象的問題進(jìn)行拆解,可以得到三個(gè)具體的具體的要求:
如何能讓使用場景更具泛化能力,而不是被有所限制;
如何能讓駕乘體驗(yàn)更絲滑舒適,而不是只會機(jī)械地程式化應(yīng)對;
如何能讓駕駛風(fēng)格更個(gè)性化擬人,而不是只提供“均碼”,本末倒置地必須讓人去適應(yīng)系統(tǒng)。
只有滿足了以上三個(gè)要求,才能稱之為一套“好用”的智能駕駛系統(tǒng)。大疆車載在思考和研發(fā)解決這些問題的過程中,引入了三個(gè)關(guān)鍵的技術(shù)思想,來定義「成行平臺」的決策規(guī)劃體系:
輕決策
通過對地圖和結(jié)構(gòu)化場景感知的“弱依賴”,提升場景泛化能力,保證任何路況下決策規(guī)劃的合理性和可用性;
防御性
決策規(guī)劃過程中,考慮感知的不確定性和自車決策的多可能性,管控好可預(yù)期的風(fēng)險(xiǎn),做到真正意義上的防御性駕駛;
預(yù)期風(fēng)險(xiǎn)規(guī)劃
通過駕駛風(fēng)格在決策規(guī)劃中的具體體現(xiàn),滿足不同駕駛員在路線偏好、駕駛操作時(shí)機(jī)方面的心理預(yù)期,減少差異,在保證安全的前提下提升通行效率。
接下來,我們將以智能駕駛的具體行泊場景為案例,詳述以上三個(gè)重要的技術(shù)思想,在量產(chǎn)智能駕駛方案中的實(shí)踐。這也是在「成行平臺」上,獨(dú)具特色的開放空間決策規(guī)劃技術(shù)(Open Space Planning 簡稱為OSP)。

首先,一切問題的討論都需要圍繞著ODD(Operational Design Domain,運(yùn)行設(shè)計(jì)域)來展開。在智能駕駛領(lǐng)域,ODD定義了系統(tǒng)和功能的運(yùn)行限制條件,例如速度范圍多少、高速封閉道路還是城區(qū)開放道路、有無地圖覆蓋、車道線是否清晰等等。但如果條件限制過多,ODD太小,則在一段完整的駕駛旅程中,智能駕駛系統(tǒng)很可能頻繁觸及邊界降級或退出,或者原本連續(xù)的ODD因?yàn)楹唵蔚膯栴}(如壓線占道、新舊車道線混合等)而斷開,超出了系統(tǒng)應(yīng)對的能力。這使得智能駕駛系統(tǒng)的體驗(yàn)大打折扣。
在傳統(tǒng)的決策規(guī)劃框架中,研發(fā)人員會根據(jù)不同的ODD定義好規(guī)則,通過行為決策-軌跡規(guī)劃的方式,在對應(yīng)的場景下找到對應(yīng)的規(guī)則,然后調(diào)用相應(yīng)的規(guī)劃器生成控制軌跡。這種架構(gòu)需要事先寫好大量的規(guī)則,故稱之為重決策方案。
重決策方案實(shí)現(xiàn)起來比較簡單,在簡單場景也算是高效。只是在需要拓展ODD,或者把旅程中不同的ODD連續(xù)起來時(shí),就需要大量的手寫規(guī)則來查缺補(bǔ)漏,最終大力出奇跡實(shí)現(xiàn)更連續(xù)的智能駕駛體驗(yàn)。
這樣做的弊端很明顯:如果遇到未學(xué)習(xí)過的場景,比如道路結(jié)構(gòu)復(fù)雜特異、千奇百怪的障礙占道形式、多交通參與者的“隨機(jī)”運(yùn)動等等,會表現(xiàn)得不夠智能甚至無法應(yīng)對。更不用提開發(fā)者需要維護(hù)大量的if-else(判斷邏輯)來做場景細(xì)分,開發(fā)測試周期和成本都很高。
舉個(gè)例子,用重決策方案規(guī)劃泊車,需要研發(fā)人員根據(jù)車輛與停車位之間的幾何關(guān)系,手寫很多倒車規(guī)則進(jìn)行倒車入庫,有點(diǎn)像駕校老師對新手司機(jī)的初級教學(xué):在大致什么位置打方向盤,倒車到什么位置再回正……如此往復(fù),確實(shí)能完成泊車。但遇到相對復(fù)雜的場景,比如斜列車位、狹小空間車位等,新手司機(jī)就會發(fā)現(xiàn)教練教的方法不好使了。
而在行車中處理加塞,重決策方案也需要根據(jù)對旁車的觀察,匹配事先寫好的規(guī)則(譬如是否在前方壓線)來給出是否減速讓行的決策。但車輛并線的場景千差萬別無法窮盡,要提升重決策方案的加塞應(yīng)對能力,就得無窮無盡地增加規(guī)則,不然總會出現(xiàn)無法應(yīng)對的邊緣案例。這不僅影響了功能體驗(yàn),對系統(tǒng)資源的消耗也徒增成本。

重決策方案是通過先驗(yàn)的場景和規(guī)則來做行車決策規(guī)劃
而「成行平臺」的OSP技術(shù),在規(guī)劃中采用了輕決策的思路,不過度依賴手寫先驗(yàn)規(guī)則,用更靈活低成本的方式,提升了系統(tǒng)的場景泛化能力:
同樣以泊車為例,OSP技術(shù)可以根據(jù)車位周邊的環(huán)境要素和車輛本身的運(yùn)動學(xué)模型,通過路徑搜索的方法規(guī)劃出多種符合本車轉(zhuǎn)向運(yùn)動能力的泊車路徑方案,然后選擇出其中最優(yōu)的方案進(jìn)行泊車。這樣可以做到在大大減少了代碼量的情況下,還能更有效地“可見即可泊入”,也真正能夠泛化通用,應(yīng)對各種極限泊車場景。
對應(yīng)到前述駕校教學(xué)的例子,OSP就像是熟悉車輛轉(zhuǎn)向性能和位置的老司機(jī),根據(jù)自車能力實(shí)時(shí)調(diào)整最優(yōu)的泊車方案,在面對復(fù)雜車位時(shí)甚至能想象設(shè)計(jì)出人類駕駛員沒有想到的路線,而不是機(jī)械地重復(fù)操作。
輕決策方案采取搜索+優(yōu)化,智能選擇最優(yōu)泊車方式
OSP在行車場景中同樣通過控制采樣+搜索的方式。首先基于本車的運(yùn)動學(xué)模型生成可達(dá)軌跡集合,然后再考慮道路結(jié)構(gòu)、交通規(guī)則、碰撞檢查、車輛交互等等因素,找出不同種類的軌跡,接著基于這些不同種類的軌跡,最后完成進(jìn)一步的行為決策和軌跡規(guī)劃。
這樣無需遍歷所有可行解,也不必完全掌握全部交通要素信息,使得在有限算力下能以較快速度找到合適的路徑,即便是出現(xiàn)車輛橫穿、逆向車流、非機(jī)動車占道等復(fù)雜情況,也能聚焦于處理真正影響行車的交通要素?cái)?shù)據(jù),保證整個(gè)旅程體驗(yàn)相對穩(wěn)定和連續(xù)。
輕決策下車輛基于運(yùn)動學(xué)模型生成的可達(dá)軌跡集合
由于是基于車輛的控制模型本身進(jìn)行采樣,OSP的搜索對于車道線、道路中心線等信息沒有很強(qiáng)的依賴,這可以很好地支持在道路結(jié)構(gòu)不清晰的情況下規(guī)劃行駛軌跡。其優(yōu)秀的“分類”和優(yōu)化能力,也保證了車輛與其他交通參與者及周圍環(huán)境互動時(shí)的安全。
這種輕決策的方式幫助車輛大大提升了智能駕駛系統(tǒng)的場景泛化能力,OSP技術(shù)可以讓車上一套決策規(guī)劃方案適用多個(gè)場景,包括沒有車道線的停車場、路況復(fù)雜的城區(qū)、以及高度結(jié)構(gòu)化的高速/快速路等。此外,OSP也能夠比較好地應(yīng)對感知的擾動或不確定性,存在如天氣、擁堵、開放道路行人等外部干擾因素的情況下,也具備很強(qiáng)的魯棒性。
通過輕決策的方式,能夠減少依賴,低成本而快速地提升ODD的連續(xù)性,但這還算不上“好用”。所謂“好用”,是指智能駕駛系統(tǒng)在處理復(fù)雜動態(tài)環(huán)境時(shí),能大致符合人類駕駛員的預(yù)期,給駕駛員提供安全舒適的感受。駕駛員對于智能駕駛系統(tǒng)能力的主觀評價(jià),往往不是體現(xiàn)在其智能程度,而是相較于自己經(jīng)驗(yàn)的預(yù)期智能系統(tǒng)實(shí)際執(zhí)行的情況如何。智能系統(tǒng)的決策規(guī)劃與預(yù)期差異越小,安全感和舒適感越強(qiáng)。
「成行平臺」所采用的的OSP技術(shù),將防御性駕駛的概念融入到?jīng)Q策規(guī)劃里,讓決策的發(fā)展和變化更加絲滑流暢,從而無限接近人類駕駛員的預(yù)期。
防御性駕駛是一種安全駕駛的理念和技巧,旨在最大程度地保護(hù)自車和其他道路使用者的安全。它強(qiáng)調(diào)預(yù)防潛在的危險(xiǎn)情況,并采取主動措施來避免事故和沖突。防御性駕駛包括以下原則和技巧:
1. 保持警覺:駕駛者應(yīng)該時(shí)刻保持警覺,觀察周圍環(huán)境,注意其他駕駛者、行人和道路條件的變化。
2. 維持安全距離:保持與前車的安全距離,以便有足夠的時(shí)間和空間來應(yīng)對緊急情況,如突然剎車。
3. 遵守交通規(guī)則:遵守所有的交通規(guī)則和法規(guī),包括限速、交通信號燈和標(biāo)志。這有助于減少沖突和事故的發(fā)生。
4. 預(yù)測他人的行為:通過觀察其他車輛的行駛方式和信號,盡量提前預(yù)測他們的行動,以便做出相應(yīng)的反應(yīng)。
5. 避免分散注意力:專心駕駛,避免分散注意力的行為,如使用手機(jī)、吃東西或與乘客聊天,以確保對道路和周圍情況的集中關(guān)注。
6. 適應(yīng)不同的路況:根據(jù)道路條件、天氣狀況和交通流量的變化,調(diào)整自己的駕駛方式和速度,確保安全駕駛。
7. 避免激進(jìn)行為:避免超速、頻繁換道、急剎車等激進(jìn)駕駛行為,以減少事故的風(fēng)險(xiǎn)。
通過遵循這些原則和技巧,駕駛者可以提升自己的安全意識,減少事故的發(fā)生,并為其他道路使用者創(chuàng)造一個(gè)更安全的駕駛環(huán)境。
要實(shí)現(xiàn)“防御性駕駛”,智能系統(tǒng)僅僅遵守交通規(guī)則是不夠的,更要能動態(tài)預(yù)測和應(yīng)對其他交通參與者的行為。這就轉(zhuǎn)化為了一個(gè)數(shù)學(xué)問題:如何計(jì)算出交通場景中各個(gè)對象的行為概率分布。這個(gè)計(jì)算結(jié)果越準(zhǔn)確,對場景中未來發(fā)生的“事件”進(jìn)行應(yīng)對的能力越強(qiáng)。
經(jīng)典的變道加塞場景中
自車會依據(jù)旁車預(yù)測軌跡做出兩種不同的決策
繼續(xù)以加塞場景為例,OSP可以給加塞車輛做兩個(gè)概率集合:加塞進(jìn)本車道和放棄加塞留在原車道。當(dāng)這兩個(gè)概率差異明顯時(shí),旁車的意圖是很好判斷的,各種規(guī)劃方案都可以有效應(yīng)對。但如果兩個(gè)概率集合差異很小,本車和旁車實(shí)際上就進(jìn)入了一種博弈狀態(tài):本車的運(yùn)動趨勢(減速讓出空間或逼近縮小空間)會影響旁車?yán)^續(xù)加塞的概率,同時(shí)旁車也難免要嘗試影響本車的決策規(guī)劃——無論這個(gè)決策規(guī)劃來自人類駕駛員還是智能駕駛系統(tǒng)。
OSP可以將旁車的多模態(tài)和自車決策的多可能性用軌跡樹進(jìn)行建模,根據(jù)未來的多種場景和概率,優(yōu)化出合適的軌跡樹進(jìn)行車輛控制。
將旁車預(yù)測和自車決策對應(yīng)到OSP中形成軌跡樹
軌跡樹和傳統(tǒng)的多軌跡模型區(qū)別在于:從自車的規(guī)劃開始到軌跡樹的第一個(gè)分叉點(diǎn),是有一段公用軌跡的,這段公用軌跡保存了未來進(jìn)入任何一個(gè)分支(即平行宇宙)的可能性,這支持了隨著時(shí)間和態(tài)勢的進(jìn)展,平滑過渡跳轉(zhuǎn)到其他決策,給車上人員更符合預(yù)期的體驗(yàn),在應(yīng)對處理中更像人類。
如下圖所示,通過調(diào)整旁車的加塞概率,同一軌跡樹優(yōu)化出來的軌跡也是不太一樣的:旁車加塞概率如果變高,當(dāng)前軌跡的減速會更大,反之就會變小。在這個(gè)模型里面,可以看到預(yù)測的概率被合理地考慮了進(jìn)來,而非傳統(tǒng)基于規(guī)則的if-else方式。
智能駕駛進(jìn)行車道保持時(shí)遭遇加塞形成的“平行宇宙”
(上:OSP軌跡樹示意 下:對應(yīng)的現(xiàn)實(shí)場景模擬)
在旁車有加塞軌跡時(shí),自車能夠輕微減速做到提前響應(yīng);在加塞概率不斷變化時(shí),自車亦能實(shí)時(shí)調(diào)整車速做到不誤剎,并且該剎也能剎住。
通過合理的軌跡樹分叉和概率模型,OSP能夠在當(dāng)前信息不夠明確時(shí)將未來不同的場景都考慮進(jìn)來,在做決策規(guī)劃時(shí)保留將來通往任何一個(gè)“平行宇宙”的可能性,從而實(shí)現(xiàn)真正的“防御性駕駛”。這也大大提升了「成行平臺」的安全性和舒適性。例如路口的車道選擇,行進(jìn)過程中的變道決策,以及遮擋區(qū)域響應(yīng)等等。
以上圖三中常見的遮擋場景(一般叫鬼探頭)為例,OSP防御性駕駛的應(yīng)對是這樣的:車輛首先會以觀測到的遮擋物為參考預(yù)估盲區(qū),再根據(jù)盲區(qū)和本車車速以及路徑的相對關(guān)系,來對車速進(jìn)行實(shí)時(shí)調(diào)整。
此時(shí),以該防御性動作建模的軌跡樹即面臨兩種可能:當(dāng)盲區(qū)突然出現(xiàn)橫穿的行人、非機(jī)動車時(shí),本車能進(jìn)行有效的剎停;而在沒有出現(xiàn)橫穿行為時(shí),本車也能夠以輕微的減速方式通過,帶給符合駕駛員的安全預(yù)期。
當(dāng)然,以上只是幾處經(jīng)常遇到的行車場景,但生活中的駕駛場景各式各樣,無法窮舉,如果你想了解OSP在更多行車場景的案例具體應(yīng)用,歡迎在評論區(qū)留言。
在防御性的加持下,仍然存在“眾口難調(diào)”的挑戰(zhàn):有人會覺得智能駕駛開得保守,效率上不如自己開;有人又會覺得過于激進(jìn),比較危險(xiǎn)。用戶駕駛風(fēng)格實(shí)際上是非常多樣化的。
面對這個(gè)問題,傳統(tǒng)的做法是給系統(tǒng)提供多組固定的參數(shù),例如手動設(shè)置跟車距離檔位,來試圖提供不同的“駕駛風(fēng)格”,但這種量化顆粒度太粗,并不夠智能。那,有沒有更好的解決方案呢?
要解決這個(gè)問題,首先需要定義和理解駕駛風(fēng)格。事實(shí)上,對于很多老司機(jī)而言,在駕駛時(shí)偏保守或激進(jìn),取決于多個(gè)因素:譬如是否趕時(shí)間、天氣可見度狀況、周圍車流情況等等。不同因素會讓資深的人類駕駛員司機(jī),在不同時(shí)間和場景下會采取不同的跟車距離和變道策略。
基于這一理解,在「成行平臺」的OSP中引入了預(yù)期風(fēng)險(xiǎn)規(guī)劃來解決“駕駛風(fēng)格”問題,即在考慮安全性的前提下,保證智能駕駛的通行效率。
保證安全并不意味著完全地保守,典型如結(jié)構(gòu)化道路下業(yè)界常用的RSS模型,這個(gè)模型放到擁擠的城區(qū)道路,會讓自動駕駛車輛走走停停,可用性有所降低。所以平衡安全性和通行效率需要更加智能的模型,在不同場景和環(huán)境中,智能匹配合適的數(shù)值,讓安全預(yù)期和通行效率預(yù)期盡可能接近人類司機(jī),并隨著使用數(shù)據(jù)的積累不斷優(yōu)化。
傳統(tǒng)的做法是,在單幀規(guī)劃的軌跡上,評估與靜態(tài)障礙物的距離,預(yù)測是否與其他動態(tài)交通參與者發(fā)生軌跡交匯,以此來判斷碰撞風(fēng)險(xiǎn)并進(jìn)行規(guī)劃:
與靜態(tài)障礙物的互動相對簡單,但不同的“駕駛風(fēng)格”中對于動態(tài)物體的碰撞風(fēng)險(xiǎn)預(yù)期是不一樣的。要做好這部分的體驗(yàn),并不需要在每一個(gè)單幀軌跡上追求完全不碰撞,而是增加“可約束風(fēng)險(xiǎn)”,從智能駕駛系統(tǒng)整體和多幀決策規(guī)劃的角度來考慮,才能規(guī)劃出安全行駛并符合人類駕駛預(yù)期的路線。
這樣就形成了靈活的“安全閾值”,這種動態(tài)的計(jì)算方法替代了手動設(shè)置的固定參數(shù),在不同“安全閾值”下OSP可以給出符合實(shí)際情況的靈活最優(yōu)解。具體到車輛控制的多個(gè)參數(shù)上,細(xì)節(jié)可以控制得更加細(xì)膩和精確,使其越來越符合人類駕駛員的“駕駛風(fēng)格”。這個(gè)過程中,偏主觀的“駕駛風(fēng)格”也轉(zhuǎn)化為了可以量化可以計(jì)算可以迭代改進(jìn)的一個(gè)模型。
寫在最后
用戶對于智能駕駛體驗(yàn)的期待,其實(shí)是來自人類駕駛的“先驗(yàn)”。在使用智能駕駛輔助功能時(shí),當(dāng)自己覺得應(yīng)該加減速或者變道時(shí),車輛能及時(shí)做出符合自己預(yù)期的動作。
當(dāng)系統(tǒng)的操作與自己的預(yù)期出現(xiàn)差異時(shí),即便仍處在安全的行駛狀態(tài)下,也會給人類駕駛員帶來不信任感和不安全感。對于這種具有高度主觀評價(jià)和個(gè)人風(fēng)格的需求,用先進(jìn)的技術(shù)思想將主觀需求量化,轉(zhuǎn)化為可以計(jì)算和優(yōu)化的數(shù)學(xué)問題,才有可能不斷改進(jìn)提升以用戶體驗(yàn)。
人類駕駛的先驗(yàn)其實(shí)并不需要對地圖、路線、道路所有元素全知全能,往往是基本的方向、更優(yōu)的車道空間、少數(shù)有限的道路標(biāo)識,就能有效引導(dǎo)人類司機(jī)開車到達(dá)目的地。對智能駕駛系統(tǒng)來說,要得到接近人類駕駛員預(yù)期的規(guī)劃結(jié)果,就必須理解這種結(jié)果的“模糊性”和“靈活性”,并在機(jī)器的智能上盡可能去擬合人類的判斷。
在「成行平臺」的決策規(guī)劃方案設(shè)計(jì)過程中,通過以往技術(shù)沉淀和“以用戶體驗(yàn)為本”的理念,最終實(shí)現(xiàn)了以“輕決策”降低對道路場景的依賴和假設(shè);在實(shí)踐“防御性駕駛”中引入軌跡樹概率模型;將“駕駛風(fēng)格”量化,實(shí)現(xiàn)安全和效率的靈活平衡,讓智能車更加像人,符合人的預(yù)期,在降低對感知要求的同時(shí)滿足多種場景的需求。
慣導(dǎo)立體雙目是「成行平臺」在感知上最具獨(dú)一性的技術(shù),OSP則是「成行平臺」在規(guī)控上最有代表性的技術(shù)?!赋尚衅脚_」在一系列自主研發(fā)的技術(shù)創(chuàng)新下,幫助車企打造門檻更低性能更好的智能駕駛功能,推動智能駕駛在全社會的普及。
我要收藏
點(diǎn)個(gè)贊吧
轉(zhuǎn)發(fā)分享
咨詢詳情:如需咨詢文中涉及的相關(guān)產(chǎn)品或解決方案詳情,請加微信:ZiDongHuaX 。
微信聯(lián)盟:智能駕駛微信群、機(jī)器人微信群、大疆車載微信群、移動機(jī)器人微信群,各細(xì)分行業(yè)微信群:點(diǎn)擊這里進(jìn)入。
鴻達(dá)安視:水文水利在線監(jiān)測儀器、智慧農(nóng)業(yè)在線監(jiān)測儀器 查看各品牌在細(xì)分領(lǐng)域的定位宣傳語
微信聯(lián)盟:智能駕駛微信群、機(jī)器人微信群、大疆車載微信群、移動機(jī)器人微信群,各細(xì)分行業(yè)微信群:點(diǎn)擊這里進(jìn)入。
鴻達(dá)安視:水文水利在線監(jiān)測儀器、智慧農(nóng)業(yè)在線監(jiān)測儀器 查看各品牌在細(xì)分領(lǐng)域的定位宣傳語


評論排行