全新的家用機器人送到您家,您讓它給您煮一杯咖啡。雖然它在模擬廚房的實踐中掌握了一些基本技能,但它能做的動作實在太多了--打開水龍頭、沖洗馬桶、倒出面粉盒等等。但可能有用的動作卻少之又少。在新的情況下,機器人該如何判斷哪些步驟是合理的呢?
它可以使用 PIGINet,這是一個旨在有效提高家用機器人解決問題能力的新系統。美國麻省理工學院計算機科學與人工智能實驗室(CSAIL)的研究人員正在利用機器學習來減少考慮所有可能行動的典型任務規劃迭代過程。PIGINet 可消除無法滿足無碰撞要求的任務計劃,只需在 300-500 個問題上進行訓練,就能將計劃時間縮短 50%-80%。
通常情況下,機器人會嘗試各種任務計劃,并不斷改進其動作,直到找到可行的解決方案,這可能會既低效又耗時,尤其是在存在可移動和鉸接障礙物的情況下。舉例來說,也許在烹飪之后,你想把所有的調味汁都放進櫥柜里。這個問題可能需要 2 到 8 個步驟,具體取決于當時的情況。機器人是否需要打開多個櫥柜門,或者櫥柜內是否有任何障礙物需要移動以騰出空間?您不希望機器人的速度慢得令人討厭--如果它在思考的時候燒了晚餐,那就更糟了。
家用機器人通常被認為是按照預先設定的配方來執行任務,但這并不總是適合多樣化或不斷變化的環境。那么,PIGINet 是如何避免這些預定義規則的呢?PIGINet 是一個神經網絡,它能接收 "計劃、圖像、目標和初始事實",然后預測任務計劃被完善的概率,從而找到可行的運動計劃。
簡單來說,它采用了變壓器編碼器,這是一種多功能的先進模型,設計用于在數據序列上運行。在本例中,輸入序列是關于正在考慮的任務計劃的信息、環境圖像以及初始狀態和預期目標的符號編碼。編碼器將任務計劃、圖像和文本結合起來,生成關于所選任務計劃可行性的預測。
以廚房為例,團隊創建了數百個模擬環境,每個環境都有不同的布局和特定的任務,需要在柜臺、冰箱、櫥柜、水槽和烹飪鍋之間重新排列物品。通過測量解決問題所需的時間,他們將 PIGINet 與之前的方法進行了比較。一個正確的任務計劃可能包括打開冰箱左門、取下鍋蓋、將卷心菜從鍋里移到冰箱、將土豆移到冰箱、從水槽中拿起瓶子、將瓶子放入水槽、拿起西紅柿或放入西紅柿。在較為簡單的場景中,PIGINet 將計劃時間大幅縮短了 80%,而在計劃序列較長、訓練數據較少的復雜場景中,PIGINet 則將計劃時間縮短了 20%-50%。
麻省理工學院教授兼 CSAIL 首席研究員萊斯利-帕克-凱爾布林(Leslie Pack Kaelbling)說:"PIGINet 等系統利用數據驅動方法的強大功能高效處理熟悉的案例,但仍能依靠'第一原理'規劃方法驗證基于學習的建議并解決新問題,提供了兩全其美的方案,為各種問題提供了可靠高效的通用解決方案?!?/p>
PIGINet 在輸入序列中使用多模態嵌入技術,可以更好地表示和理解復雜的幾何關系。使用圖像數據有助于模型在不知道物體三維網格的情況下掌握空間布局和物體配置,從而進行精確的碰撞檢查,實現在不同環境中的快速決策。
在 PIGINet 的開發過程中,面臨的主要挑戰之一是缺乏良好的訓練數據,因為所有可行和不可行的計劃都需要由傳統的規劃器生成,而傳統的規劃器首先速度較慢。然而,通過使用預訓練的視覺語言模型和數據增強技巧,該團隊能夠應對這一挑戰,不僅在處理已見物體的問題上顯示出令人印象深刻的計劃時間縮短效果,而且還能對以前未見的物體進行零點泛化。
"由于每個人的家都不一樣,機器人應該成為適應性強的問題解決者,而不僅僅是食譜的追隨者。我們的關鍵想法是讓通用任務規劃器生成候選任務計劃,并使用深度學習模型選擇有前途的計劃。這樣,家用機器人的效率更高、適應性更強、更實用,即使在復雜多變的環境中也能靈活導航。此外,PIGINet 的實際應用還不僅限于家庭?!癇eomjoon Kim 博士表示:“本文解決了實現通用機器人的基本挑戰:如何從過去的經驗中學習,以加快在充滿大量鉸接式和可移動障礙物的非結構化環境中的決策過程。 。
韓國科學技術院(KAIST)人工智能研究生院助理教授。此類問題的核心瓶頸是如何確定高層任務計劃,從而存在實現高層計劃的低層運動計劃。通常,您必須在運動和任務規劃之間搖擺,這會導致嚴重的問題。計算效率低下。朱田的工作通過使用學習來消除不可行的任務計劃來解決這個問題,并且是朝著有希望的方向邁出的一步。
2025-04-10 05:16
2025-04-10 05:15
2025-04-10 05:13
2025-04-10 05:11
2025-04-10 05:11
2025-04-10 05:10
2025-04-10 05:09
2025-04-10 05:08
2025-04-09 12:44
2025-04-09 12:44