
機(jī)器人自主導(dǎo)航
機(jī)器人通過傳感器實(shí)時(shí)感知周圍環(huán)境、通過導(dǎo)航算法生成動作指令,躲避障礙物的同時(shí)移動到指定的目標(biāo)點(diǎn)或?qū)ふ业街付繕?biāo)。導(dǎo)航作為機(jī)器人和人工智能的一項(xiàng)基本任務(wù),研究如何提高導(dǎo)航性能、實(shí)現(xiàn)更加擬人的智能導(dǎo)航十分重要。
導(dǎo)航的關(guān)鍵在于如何確定機(jī)器人自身在環(huán)境中的位置、如何理解周圍環(huán)境、如何到達(dá)目標(biāo)地點(diǎn)。
傳統(tǒng)導(dǎo)航與基于深度學(xué)習(xí)導(dǎo)航
n 傳統(tǒng)導(dǎo)航框架
? 傳統(tǒng)導(dǎo)航框架將上述問題劃分為三大研究方向:定位Location、地圖構(gòu)建Mapping和路徑規(guī)劃Navigation;
? 基于即時(shí)定位與地圖構(gòu)建(SLAM)生成環(huán)境地圖,再通過定位算法確定機(jī)器人在環(huán)境中的位置,最后由路徑規(guī)劃算法控制機(jī)器人移動到指定目標(biāo)點(diǎn)。
這種將導(dǎo)航任務(wù)分為三個(gè)模塊的方法,存在很多難點(diǎn):
1. 是對每一部分都需要單獨(dú)研究,最終彼此配合共同完成導(dǎo)航任務(wù),因此模塊集成時(shí)會面臨很多問題,如集成過程中的誤差累加問題。
2. 是傳統(tǒng)導(dǎo)航框架十分依賴地圖構(gòu)建,對傳感器噪聲十分敏感,以至在未知?jiǎng)討B(tài)環(huán)境中表現(xiàn)較差。
3. 是基于地圖作路徑規(guī)劃的方法其特征學(xué)習(xí)能力有限,會產(chǎn)生較大的回環(huán)誤差。
n 基于深度學(xué)習(xí)導(dǎo)航
隨著深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)的成功,以及其在低成本和高效的無監(jiān)督學(xué)習(xí)方面的良好表現(xiàn),基于學(xué)習(xí)的導(dǎo)航方法也愈發(fā)流行。此類方法將感知信息作為輸入,無需構(gòu)建環(huán)境地圖來做定位、路徑規(guī)劃,而是依賴神經(jīng)網(wǎng)絡(luò)直接輸出動作指令。因此這類方法更加智能、模塊間的冗余和耦合調(diào)試成本更小、網(wǎng)絡(luò)的計(jì)算效率和魯棒性更高,在未知?jiǎng)討B(tài)環(huán)境中的表現(xiàn)也更加優(yōu) 秀。
智能導(dǎo)航-賦予記憶和推斷
常規(guī)導(dǎo)航只是感知到?jīng)Q策的映射,本質(zhì)上是基于避障能力來完成導(dǎo)航任務(wù),仍缺乏人類大腦的思維方式、認(rèn)知能力。人類完成導(dǎo)航任務(wù),主要基于記憶能力和推斷能力。記憶能力,一方面是對環(huán)境信息的記憶,如人類會對自己曾經(jīng)探索過的環(huán)境十分熟悉;另一方面,也是對導(dǎo)航過程的記憶,如在某個(gè)房間內(nèi)未發(fā)現(xiàn)目標(biāo)物體,人類一般不會再次進(jìn)入重復(fù)尋找。而推斷能力是指人類會根自身多年來構(gòu)建的先驗(yàn)知識推斷出有利于完成導(dǎo)航任務(wù)的信息,如目標(biāo)物最可能在哪個(gè)房間、最可能在哪些物體附近,又如,為了找到水果我們會嘗試前往冰箱,而當(dāng)發(fā)現(xiàn)微波爐時(shí)我們會認(rèn)為冰箱很可能就在附近。
提升機(jī)器人導(dǎo)航性能,使導(dǎo)航更加智能化的關(guān)鍵在于,如何令機(jī)器人在導(dǎo)航過程中模仿人類的思維方式,即擁有記憶能力和推斷能力,以及如何實(shí)現(xiàn)二者的有機(jī)結(jié)合。
通過語義圖譜和拓?fù)涞貓D的在線交互實(shí)現(xiàn)了記憶能力和推斷能力的有機(jī)結(jié)合,從而實(shí)現(xiàn)了更加擬人的智能導(dǎo)航。
n 拓?fù)溆洃?/span>
地圖是對環(huán)境信息的記錄,可以看作為機(jī)器人提供了環(huán)境記憶能力。傳統(tǒng)導(dǎo)航框架中,需要首先構(gòu)建環(huán)境地圖,再基于地圖作定位、路徑規(guī)劃,這種將地圖作為參考的導(dǎo)航方式在一定程度上就賦予了機(jī)器人記憶環(huán)境的能力。
其中,地圖可以是預(yù)先構(gòu)建的,也可以是在導(dǎo)航的過程中同步構(gòu)建;可以使用能夠精 確表示環(huán)境信息的度量地圖,如3D 點(diǎn)云圖,也可以使用由節(jié)點(diǎn)和邊構(gòu)成的拓?fù)涞貓D,此外還可將拓?fù)涞貓D和度量地圖相結(jié)合,以進(jìn)一步提升機(jī)器人導(dǎo)航效果。
而隨著神經(jīng)網(wǎng)絡(luò)的發(fā)展,直接使用神經(jīng)網(wǎng)絡(luò)搭建記憶模塊,隱式地記錄環(huán)境特征也可以幫助機(jī)器人獲取記憶能力。一般來說,內(nèi)部記憶僅依賴導(dǎo)航網(wǎng)絡(luò)自身來記錄環(huán)境信息,其網(wǎng)絡(luò)容量有限,在對長期記憶要求較高的導(dǎo)航任務(wù)中性能有限。而外部記憶可通過單獨(dú)的外部記憶模塊來將外部內(nèi)存資源與神經(jīng)網(wǎng)絡(luò)耦合,以此提高神經(jīng)網(wǎng)絡(luò)記憶容量、擴(kuò)展網(wǎng)絡(luò)的功能。
n 語義推斷
圖譜也由節(jié)點(diǎn)和邊構(gòu)成,節(jié)點(diǎn)代表環(huán)境中的各類物體,邊表示物體間的相關(guān)性。首先在數(shù)據(jù)集上構(gòu)建環(huán)境中各類物體的語義關(guān)系圖譜,然后在線導(dǎo)航過程中,根據(jù)當(dāng)前觀測到的物體來更新語義圖譜節(jié)點(diǎn)向量,再通過圖神經(jīng)網(wǎng)絡(luò)提取語義信息用于導(dǎo)航策略生成。提取到的語義信息便可以提供一種語義傾向性,幫助機(jī)器人獲取推斷能力。
設(shè)計(jì)圖譜信息與視覺信息的融合機(jī)制,以提取出和導(dǎo)航任務(wù)最為相關(guān)的信息;同時(shí)通過設(shè)置子目標(biāo),將一條軌跡劃分為多條,以加快訓(xùn)練過程、提高數(shù)據(jù)效率。在物體間構(gòu)建了父類子類關(guān)系并用于設(shè)計(jì)獎(jiǎng)勵(lì),訓(xùn)練時(shí)傳播回圖神經(jīng)網(wǎng)絡(luò)層,以學(xué)習(xí)到這種層次關(guān)系。此外,除了語義圖譜預(yù)構(gòu)建的方法,還提出了圖譜鄰接矩陣可訓(xùn)練的方法,使得無需預(yù)先定義語義圖譜中各物體之間的關(guān)系。
公眾號 掃碼咨詢
![]() | 上海市閔行區(qū)中春路4999號莘莊商務(wù)樓1326室 |
![]() | service@covond.com |
![]() | www.jxetj.com |
![]() | 交換機(jī):18017588179(孫經(jīng)理) 無人機(jī):13311882358(孫總) |