首頁>論壇 > 正文

      谷歌 DeepMind 推出無需監(jiān)督即可自學(xué)的人工智能機器人 要聞

      2023-06-27 17:31:10    出處:站長之家

      站長之家(ChinaZ.com) 6月26日消息:機器人正迅速成為我們?nèi)粘I畹囊徊糠郑鼈兺ǔV槐痪幊虂硗瓿商囟ǖ娜蝿?wù)。盡管利用人工智能的最新進展可能會導(dǎo)致機器人在更多方面發(fā)揮幫助作用,但構(gòu)建通用機器人的進展較慢,部分原因是需要收集現(xiàn)實世界的培訓(xùn)數(shù)據(jù)。

      日前谷歌 DeepMind 最新的論文介紹了一種自我改進的機器人人工智能代理程序,名為 RoboCat,它學(xué)習(xí)執(zhí)行不同機械臂上的各種任務(wù),然后自動生成新的訓(xùn)練數(shù)據(jù)來改善其技術(shù)。


      (資料圖)

      DeepMind 表示,先前的研究探索了如何開發(fā)能夠按比例學(xué)習(xí)多項任務(wù)并將語言模型的理解能力與協(xié)助機器人的現(xiàn)實能力相結(jié)合的機器人。RoboCat 是第一個解決并適應(yīng)于多個任務(wù),并在不同的真實機器人上完成的代理程序。

      RoboCat 學(xué)習(xí)速度比其他最先進的模型快得多。它可以通過僅使用 100 個演示來掌握新任務(wù),因為它依靠大量和多樣化的數(shù)據(jù)集。這種能力將有助于加速機器人學(xué)研究,因為它減少了人工監(jiān)督培訓(xùn)的需求,并是創(chuàng)建通用機器人的重要一步。

      DeepMind 的研究科學(xué)家兼 RoboCat 團隊成員之一的 Alex Lee 在接受 TechCrunch 的電子郵件采訪時表示:「我們證明了一個單一的大型模型可以在多個真實機器人實體上解決各種不同的任務(wù),并能夠快速適應(yīng)新的任務(wù)和實體。

      RoboCat 是受 Gato 啟發(fā)而開發(fā)的,Gato 是 DeepMind 的一個人工智能模型,可以分析和處理文本、圖像和事件。RoboCat 使用在模擬和現(xiàn)實生活中收集的圖像和行動數(shù)據(jù)進行訓(xùn)練。Lee 表示,這些數(shù)據(jù)來自虛擬環(huán)境中其他控制機器人模型、人類控制機器人以及之前的 RoboCat 模型的組合。

      為了訓(xùn)練 RoboCat,DeepMind 的研究人員首先收集了 100 到 1000 個由人類控制的機器人臂執(zhí)行任務(wù)的示范。然后,他們在該任務(wù)上對 RoboCat 進行了微調(diào),創(chuàng)建了一個專門的「分支」模型,平均訓(xùn)練了該任務(wù) 1 萬次。

      利用分支模型生成的數(shù)據(jù)和示范數(shù)據(jù),研究人員不斷擴充了 RoboCat 的訓(xùn)練數(shù)據(jù)集,并訓(xùn)練了后續(xù)的新版本 RoboCat。

      RoboCat 的最終版本在模擬和實際世界中的 141 種不同變體的任務(wù)集上進行了訓(xùn)練,總共涵蓋了 253 個任務(wù)。DeepMind 聲稱,在觀察了數(shù)小時的人類控制示范后,RoboCat 學(xué)會了操作不同的機器人臂。

      雖然 RoboCat 在四種帶有雙爪臂的機器人上進行了訓(xùn)練,但該模型能夠適應(yīng)一個帶有三指夾爪和兩倍可控輸入的更復(fù)雜的臂。

      盡管在 DeepMind 的測試中,RoboCat 在不同任務(wù)上的成功率差異很大,從最低 13% 到最高 99%。這是在訓(xùn)練數(shù)據(jù)中有 1000 個示范的情況下;當示范數(shù)量減少一半時,成功率可預(yù)見地較低。

      然而,在某些場景中,DeepMind 聲稱 RoboCat 只需 100 個示范就能學(xué)會新任務(wù)。

      Lee 補充說:「通過提供有限數(shù)量的示范來進行新任務(wù)的微調(diào),RoboCat 可以自動生成更多數(shù)據(jù)以進一步改進。」未來,研究團隊的目標是將 RoboCat 學(xué)習(xí)完成新任務(wù)所需的示范數(shù)量降低到 10 個以下。

      閱讀DeepMind在 arXiv 上的論文:https://arxiv.org/abs/2306.11706

      關(guān)鍵詞:

      消費
      產(chǎn)業(yè)
      天天觀熱點:6月26日基金凈值:建信臻選混合最新凈值0.8263,跌1.05% 6月26日,建信臻選混合最新單位凈值為0 8263元,累計凈值為0 8263元,
      世界熱消息:CIVC 2023第一屆中國工業(yè)視覺大會在蘇州舉辦 央廣網(wǎng)蘇州6月26日消息(記者鄭楚豫)6月26日,CIVC2023第一屆中國工業(yè)
      當前觀點:恒輝安防:未來三年股東分紅回報規(guī)劃 恒輝安防(SZ300952,收盤價:22 57元)6月26日晚間發(fā)布公告稱,公司董
      2023年鄭州人才公寓第三批開放時間+房源 2023年鄭州人才公寓第三批開放時間這個應(yīng)該要到6月底了。截至6月26日,
      基金
      红杏亚洲影院一区二区三区| 日韩精品成人亚洲专区| 亚洲综合伊人久久大杳蕉| 久久亚洲AV成人无码国产电影| 亚洲 欧洲 日韩 综合在线| 亚洲一区二区三区四区视频| 亚洲国产精品成人精品软件 | 亚洲男人天堂2017| 亚洲精品无码成人片久久| 久久久久久久亚洲精品| 国产亚洲精品激情都市| 精品亚洲一区二区三区在线播放| 亚洲日韩精品无码专区网站| 亚洲精品视频久久久| 国产亚洲精午夜久久久久久| 亚洲伊人久久综合中文成人网| 亚洲高清成人一区二区三区| 亚洲中文字幕无码爆乳av中文| 久久久久亚洲精品无码网址| 亚洲中文字幕在线乱码| 精品国产综合成人亚洲区| 亚洲国产精品一区二区三区久久| 无码专区一va亚洲v专区在线| 亚洲精品无码av天堂| 国产国拍精品亚洲AV片| 亚洲中文字幕久久精品无码APP | 亚洲综合色区中文字幕| 成人区精品一区二区不卡亚洲| 亚洲一卡一卡二新区无人区| 亚洲国产区男人本色| 亚洲av无码专区在线电影| 亚洲爆乳无码专区www| 国产在亚洲线视频观看| 亚洲国产视频网站| 亚洲男人的天堂久久精品| 亚洲精华液一二三产区| 亚洲国产激情一区二区三区| 国产亚洲精品免费视频播放| 亚洲国产精品成人久久| 亚洲第一页在线播放| 亚洲va在线va天堂va888www|