国产午夜精品一区二区三区不卡_久在线精品视频_成人午夜网站_国内精品一区二区

首頁 > 活動線報 > 每日福利 > 上海發布首個機器人通用“大腦”:能聽懂人話自主思考,掛衣服分這幾步完成

上海發布首個機器人通用“大腦”:能聽懂人話自主思考,掛衣服分這幾步完成

發布時間:2025-03-10 17:39:32來源: 13041198719

上海人形機器人再迎重要進展。3月10日,智元機器人發布智元啟元大模型GO-1(Genie Operator-1),這是全國首個通用具身基座大模型,并成功部署到多款機器人本體。據悉,GO-1可以利用人類視頻學習,還能夠在極少數據甚至零樣本下,使機器人適應不同場景和任務,降低具身模型的使用門檻。

基于百萬級真機數據構建

“GO-1大模型基于具身領域的數字金字塔所構建,吸納了人類世界多種維度和類型的數據。”智元合伙人、具身業務部總裁姚卯青向記者展示了一個數字金字塔。


智元展示的數字金字塔。

底層是互聯網的大規模純文本與圖文數據,可以幫助機器人理解通用知識和場景,第二層是大規模人類操作及跨本體視頻,可以幫助機器人學習人類或者其他本體的動作操作模式。第三層是仿真數據,用于增強泛化性,讓機器人適應不同場景、物體等。金字塔的頂層,則是高質量的真機示教數據,用于訓練精準動作執行。

但是常規的VLA(視覺語言動作)架構,無法利用大規模人類及跨本體操作視頻數據,缺少了一個重要的數據來源,導致迭代的成本更高,進化的速度更慢。

簡單來說,以往的機器人都是通過網絡的圖文數據以及仿真數據來“模仿”人的行為,但沒有真人“手把手”教機器人遇到各種情況應該怎么做。

為解決具身智能的數據難題,智元在去年底推出了AgiBot World真機數據集,包含超過100萬條軌跡、涵蓋217個任務、涉及五大場景。以此作為基礎,智元在今天發布通用具身基座大模型GO-1。


智元推出首個具身通用大模型GO-1。

在AgiBot World誕生之前,谷歌也構建了一組不同機器人訓練的開源數據集Open X-Embodiment,但由于大部分數據缺乏統一標準化的采集流程,質量格式參差不齊。

相比之下,智元AgiBot World數據集從抓取、放置、推、拉等基礎操作,到攪拌、折疊、熨燙等精細長程、雙臂協同復雜交互,幾乎涵蓋了日常生活所需的絕大多數動作需求。其長程數據規模高出10倍,場景范圍覆蓋面擴大100倍,數據質量從實驗室級上升到工業級標準。

“這些機器人的動作數據集看似非常基礎,沒有什么炫酷的展示,但數據精度和涵蓋面算是全球頂級的。”上海智元機器人渠道銷售總監劉強表示。

平均成功率提高32%

有了高質量的數據保障,更可靠的技術架構也要跟上。

為了更好利用這些數據,智元提出了全新的ViLLA(視覺語言隱式動作)架構,與VLA架構相比,能通過預測Latent Action Tokens(隱式動作標記),彌合圖像—文本輸入與機器人執行動作之間的鴻溝,增強機器人的泛化能力。

通過ViLLA架構,智元機器人在五種不同復雜度任務上測試GO-1,相比已有的最優模型,GO-1成功率大幅領先,平均成功率提高了32%。其中,倒水、清理桌面、補充飲料三項任務表現尤為突出。這也意味著,GO-1在真實世界的靈巧操作和長時任務方面表現卓越,遠遠超過最先進的開源具身基座模型。


測試結果顯示,GO-1性能全球領先。

姚卯青表示,GO-1大模型可以幫機器人完成全面的“基礎教育”和“職業教育”,天然能適應新的場景,可以輕松面對多種多樣的環境和物體,快速學習新的操作。

他以“掛衣服”為例,模型可以根據看到的畫面,理解這句話對應的任務要求,然后根據之前訓練時看過的掛衣服數據,設想這個過程包括哪些操作步驟,最后執行這一連串的步驟,完成整個任務的操作。

如果分解來看,機器人掛衣服需要分四步走:

第一步:機器人通過“互聯網的大規模純文本和圖文數據”學習,理解了“掛衣服”這句話在此情此景下的含義和要求;

第二步:機器人學習過人類操作視頻和其他機器人的各種操作視頻,知道“掛衣服”這件事包含的所有步驟和環節;

第三步:由于仿真數據中包含不同衣服、不同衣柜、不同房間等場景,機器人在“仿真世界”中模擬出“掛衣服”所有操作,因此能理解每一個操作環節中對應的物體和環境。

第四步:通過預先學習的真人示教數據,機器人能精準完成“掛衣服”整個任務的操作。

機器人“大腦”日漸成熟

GO-1作為通用具身基座大模型,也就是說,這一大模型不再被機器人的具體型號、適用場景束縛,而是具備泛化能力,可以支持不同機器人快速適應新任務和學習新技能。

姚卯青介紹,GO-1大模型可以結合互聯網視頻和真實人類示范進行學習,增強模型對人類行為的理解。通過強大的泛化能力,GO-1能夠在極少數據甚至零樣本下泛化到新場景、新任務,降低了具身模型的使用門檻,使得后訓練成本非常低。

值得一提的是,GO-1大模型還搭配了智元一整套數據回流系統,可以從實際執行遇到的問題數據中持續進化學習,越用越聰明。

通用大模型與具身智能的結合,是機器人邁向AGI(通用人工智能)的必經之路,而具身基座大模型也標志著機器人的“大腦”正日漸成熟。

事實上,十幾年前,機器人就可以“擦桌子”“拉小提琴”,這似乎不是什么新鮮事。但過去這些機器人,只是在完成預設程序,并不代表機器人具備自主完成任務的能力,或者說并不真正具備智能。如今,隨著具身智能的不斷演化,聰明的機器人已完成“從單一任務到多種任務”“從封閉環境到開放世界”“從預設程序到指令泛化”的三層進化。

“目前,機器人能夠在不同場景中執行多種任務,而不需要針對每個新任務重新訓練,也不再局限于預設程序,能夠理解自然語言指令,并具備一定推理能力。”姚卯青表示,機器人一旦“聽懂人話”,就能在商業、工業、家庭等多領域發揮更大的作用。

原標題:上海發布首個機器人通用“大腦”:能聽懂人話自主思考,掛衣服分這幾步完成 

每日福利更多>>

限時20萬內拿下獵裝美學!極氪007GT勝算幾成?入門版夠用了 A級車價格享受B級車品質,25款EV5優惠至高可達5.1萬 美國3月車市銷量大漲,2025年卻可能跌入“寒冬”? 豐田全球CTO:中國工程師可以主導中國市場產品研發 傳祺向往S7對比理想L6,誰才是家用20萬級大五座SUV的終極答案? 動力電池新國標實施在即,吉利用15萬級電車撞出底氣 沃爾沃的“軟與硬”,讓我們堅信:有愛的企業,終將被用戶托舉! 中國主要上市車企2024財報業績情況簡析 汽車廠家積極行動 規范智駕術語名詞 宏光帶增程,創業快又神,全球首款6萬級增程后驅MPV來了 面對產品力更出色的阿維塔06,你是否還會選擇小米SU7? L5之前智能駕駛一定要走軟硬結合路線且不能幫企業定義品牌 未來3-5年最關注四件事 小鵬汽車出海不靠打低價牌 開放共創 + 硬核科技!iCAR 打造個性化出行新范本 聽取消費者聲音 智己L6全面升級 全系800V+靈蜥數字底盤+四輪轉向 續航700km還有智駕,體驗紅旗首款純電SUV,若售18萬Model Y將壓力不小 2025上海車展:一汽-大眾與一汽奧迪展示智能化、電動化轉型成果 上海車展,大眾集團火力爆棚,這些新車請你關注 上海車展主場優勢全力出擊!上汽大通展臺亮點提前劇透 漢唐L蘭州震撼上市,開啟新能源汽車新時代! 鴻蒙系統廣告比安卓還多?實測對比:誰才是真正的“純凈系統”? vivo Pad SE平板參數曝光:驍龍4 Gen2處理器、8500mAh電池 2025年如何選擇最佳筆記本電腦CPU 成本更低、換新更快!高性能電腦掀起租賃熱 上汽 3 月反超比亞迪!上海車企新能源賽道 “逆襲” 背后的秘密→ 何小鵬:小鵬P7 +超長續航Max旗艦版將于上海車展發布 奶爸神車他來了——理想L6,24.98萬! 京東未來三個月將招聘十萬名騎手 環球房產周報:北京加碼保租房,蘇州發布公積金新政…… vivo X200s神秘配置曝光?6200mAh+自研芯,4K起售是真是假?