不同的機器人末端執行器
機器人學家通常通過遠程操作機器人執行任務來教機器人新的任務。然后,機器人模仿演示,直到它能獨立完成任務。
雖然這種教授機器人的方法是有效的,但它將演示限制在實驗室環境中,而且只有程序員和機器人專家可以做演示。谷歌公司機器人部門的一個研究小組一直在為機器人開發一種新的學習方法。
人類一直在通過觀察來學習,但對機器人來說,這不是一個簡單的任務。這對機器人來說是很困難的,因為它們看起來與人類不同。例如,一個擁有雙指抓手的機器人不會從觀察一個擁有五指手的人類拿起一支筆的過程中獲得多少知識。
為了解決這個問題,該團隊引入了一種自我監督的跨環境逆向強化學習(XIRL)方法。
這種教學方法的重點是機器人從視頻中學習高層次的任務目標。因此,機器人不是試圖使單個人類行動與機器人行動相對應,而是弄清楚其最終目標是什么。
然后,它以獎勵函數的形式總結該信息,該函數對形狀、行動和末端效應器動態等物理差異是不變的。通過利用學到的獎勵和強化學習,研究小組教機器人如何通過試驗和錯誤處理物體。
當樣本視頻更加多樣化時,機器人學得更多。實驗表明,該團隊的學習方法導致在新的體現上的樣本效率強化學習提高了2到4倍。
該團隊已經對其方法和X-MAGICAL(其模擬的跨實例模仿的基準)進行了開源實施,以便讓其他人在他們的工作基礎上進行擴展和建設。
X-MAGICAL的創建是為了評估XIRL在一個一致的環境中的表現。該程序挑戰一組具有不同形狀和終端效應器的代理體現,以執行一項任務。這些代理以不同的方式和速度執行任務。
展示不同的形狀在X-MagICAL中執行任務。|來源:谷歌
該團隊還使用真實世界的人類示范任務進行教學。他們用自己的方法來訓練模擬的索耶爾手臂將冰球推入目標區域。他們的教學方法也優于基線方法。
該研究團隊包括來自谷歌機器人技術的 Kevin Zakka、Andy Zeng、Pete Florence、Jonathan Tompson 和 Debidatta Dwibedi,以及來自斯坦福大學的 Jeannette Bohg。
Google正在成立一個名為 “Area 120” 的部門,該部門由公司高管 Don Harrison 和 Bradley Horowitz 直接負責,用于支持員工進行內部創業。員工可提 BP申請加入,被批準后其自發組織的團隊便可全職為新想法而工作,如果成功的話可以單獨成立公司并獲得 Google 投資。有評論稱Google此舉是為了阻止員工跳槽創業公司。
Google成立新部門Area120支持員工內部創業
這個名為“Area 120”的Google內部創業孵化器由公司高管唐·哈里斯(Don Harrison)和布拉德利·霍洛維茨(Bradley Horowitz)掌管。在最近舉行的全員大會上,兩位高管對新組織做了介紹。
“Area 120”辦公地位于Google舊金山新辦公樓內。Google高管希望Area 120可以讓富有企業家精神的員工在公司工作更長時間,同時還可以物色大創意。孵化器主要面向員工,目的是保持創業氛圍,和一些熱門企業家建立聯系。孵化器的運作細節尚未確定,目前大體框架如下:Google團隊可以申請加入孵化器,全職工作幾個月,提交具體商業計劃;之后,他們有機會收到Google的投資意向書,建立一家新公司,Google是投資者。
Google有一個眾所周知的傳統就是鼓勵員工用20%的工作時間研究自己喜歡的項目,新孵化器之所以取名“Area 120”正是向該制度致敬。從理論上講,Area 120允許員工全職研究喜歡的項目。
目前Google已經成立了Google風投(Google Ventures)和Google資本(Google Capital)兩家公司,它們的目標也是為創業公司提供資金支持,將一些富有企業家精神的前Google員工留在公司之內。不清楚這些基金公司是否會與Area 120合作,照推測Area 120的資金應該來自Google企業發展預算之外。
2025-04-29 22:24
2025-04-29 22:23
2025-04-29 22:22
2025-04-29 22:22
2025-04-29 22:21
2025-04-29 22:20
2025-04-29 22:19
2025-04-29 22:18
2025-04-29 22:17
2025-04-29 22:16