美國加州大學伯克利分校、西蒙弗雷澤大學和喬治亞理工學院的聯合機器人團隊最近創建了一種強化學習模型,能讓四足機器人以守門員的身份高效踢足球。在arXiv上預先發表的一篇論文中介紹的該模型,通過反復試驗不斷提高了機器人的技能。
研究人員稱,通過讓四足機器人踢足球,可突破四足機器人的人工智能極限。守門員是一項有趣但具有挑戰性的任務,它需要機器人對快速移動的球作出反應,有時需在空中飛行,并在很短的時間內(通常在一秒鐘內)動態攔截它。
新研究的主要目標是創造一個四足機器人守門員,它可像人類守門員一樣在比賽中完善其技能。為此,研究人員開發了一種強化學習模型,讓該模型通過試錯而不是固定的人工設計策略來訓練機器人。
研究人員解釋說,機器人首先學習不同的運動控制策略來執行不同的技能,例如躲避、前撲和跳躍,同時記錄機器人腳趾的隨機軌跡。基于這些控制策略,機器人接著學習高級規劃策略,在檢測到球的位置和自身狀態后,選擇最佳技能和動作來攔截球。
經過一系列模擬足球比賽,團隊訓練了強化學習模型。隨后他們將它學到的策略部署在麻省理工學院開發的四足機器人Mini Cheetah上,并在現實世界中測試了它的性能。
研究表明,強化學習框架可極大地提高Mini Cheetah作為足球守門員的能力。在真實世界測試的40次隨機射門中,機器人撲救成功率達87.5%。
研究人員稱,此項工作最酷炫的是,四足機器人Mini Cheetah能執行跳躍和前撲等非常敏捷的運動技能,以及快速和精確的操作技能,例如在一瞬間擺動機器腿把球推開。這實際上突破了機器人領域“腿運動”的界限,表明腿也可以是一個機械手。
由于該模型可提高四足機器人的敏捷性和身體能力,因此這些機器人還可用于處理完全不同的任務,例如搜索和救援任務。也許不久的將來,四足機器人也可與人類足球運動員同場競技。
【總編輯圈點】
踢球和守門有多難?對某些球隊來說,確實很難,但對機器人來說,更不容易。其實,大多數人類做起來流暢自如、渾然天成的運動動作,對機器人來說都可能是技術上的重大障礙。這就是“算法”與“天然”之間的鴻溝。現在,工程師們嘗試用機器學習跨越這道鴻溝,不是預先編好程序,而是讓人工智能在練習和試錯中,逐漸掌握動作。最終,連機器人都成了不錯的守門員。