三级日本 三级韩国 三级欧美,国产精品卡1卡2卡3网站,亚洲人成网站色ww,久久精品国产精品青草app,99精品国产在热久久婷婷,成人无码网www在线观看 ,久久人妻公开中文字幕,黑色丝袜国产精品

    基于數(shù)萬次真機(jī)評測,機(jī)器人大模型年度評測報告發(fā)布

    當(dāng)大語言模型在數(shù)字世界不斷刷新人類認(rèn)知邊界,一場關(guān)于 AI 如何“扎根”現(xiàn)實(shí)物理世界的革命正悄然進(jìn)行。

    基于數(shù)萬次真機(jī)評測,機(jī)器人大模型年度評測報告發(fā)布

    來源:中國日報網(wǎng) 2026-02-04 15:09
    • weixin
    • weibo
    • qqzone
    分享到微信

    中國日報2月4日電(記者 馬思)當(dāng)大語言模型在數(shù)字世界不斷刷新人類認(rèn)知邊界,一場關(guān)于 AI 如何“扎根”現(xiàn)實(shí)物理世界的革命正悄然進(jìn)行。全球首個具身智能大規(guī)模真機(jī)評測平臺—— RoboChallenge 近日正式發(fā)布首份年度報告。報告基于過去數(shù)月內(nèi)(2025 Q4~2026 Q1)平臺完成的數(shù)萬次嚴(yán)苛遠(yuǎn)程真機(jī)測試,以大規(guī)模、標(biāo)準(zhǔn)化、可復(fù)現(xiàn)的數(shù)據(jù),客觀揭示了當(dāng)前視覺-語言-動作模型在真實(shí)物理環(huán)境中的能力邊界與共性挑戰(zhàn)。

    近年來,大語言模型與視覺語言模型取得了爆發(fā)式突破,人工智能在感知、認(rèn)知與推理層面展現(xiàn)出驚人潛力。然而,將這種能力可靠地賦予機(jī)器人,使其在復(fù)雜多變的物理世界中理解、決策并執(zhí)行任務(wù),仍是橫亙在研究者面前的巨大挑戰(zhàn)。真機(jī)測試長期面臨難以復(fù)現(xiàn)、缺乏統(tǒng)一標(biāo)準(zhǔn)、成本高昂等核心痛點(diǎn),導(dǎo)致模型評估往往停留在仿真環(huán)境或有限場景,其“現(xiàn)實(shí)世界智能”成色幾何,始終難以量化評判。RoboChallenge正是為破解這一行業(yè)共性難題而生。

    據(jù)悉,作為由原力靈機(jī)與 Hugging Face 聯(lián)合發(fā)起的全球首個具身智能大規(guī)模真機(jī)評測平臺,RoboChallenge致力于構(gòu)建一個開放、公正、可大規(guī)模復(fù)現(xiàn)的“真實(shí)考場”。自 2025 年 10 月 15 日正式上線以來,平臺已成功部署了包含 UR5、Franka Panda、ARX5、ALOHA 等四大主流機(jī)型在內(nèi)的 20 臺真機(jī)集群,構(gòu)筑起一個穩(wěn)定、多元的遠(yuǎn)程物理測試網(wǎng)絡(luò)。

    為推動真機(jī)評測走向規(guī)范化、標(biāo)準(zhǔn)化,2025 年 11 月 20 日,原力靈機(jī)與 Hugging Face 深度集結(jié)智源研究院、智元機(jī)器人、Qwen、星海圖、自變量、清華大學(xué)、西安交通大學(xué)及 GOSIM,共同成立了 RoboChallenge 組委會。

    基于對海量真機(jī)測試數(shù)據(jù)的深度分析,RoboChallenge 年度報告揭示了以下核心發(fā)現(xiàn)與亮點(diǎn)觀察:基礎(chǔ)任務(wù)趨近成熟,“疊碗”和“物體移入盒子”兩項任務(wù)因其相對較高的成功率,成為多數(shù)模型首選的驗(yàn)證性任務(wù),類似具身智能的入門“考題”。復(fù)雜任務(wù)依然“屹立不倒”:涉及多步驟序列決策、長期規(guī)劃及精細(xì)靈巧操作的任務(wù),如“整理紙杯”、“制作三明治”等,

    此外,報告指出,對當(dāng)前所有參測模型而言仍極具挑戰(zhàn),成功率長期處于低位,部分甚至接近零。當(dāng)前在 Table30 評測集上表現(xiàn)最佳的模型,其整體成功率也僅在 50% 左右。這既體現(xiàn)了現(xiàn)有模型的進(jìn)步,也充分說明了 Table30 任務(wù)集設(shè)計的挑戰(zhàn)性與現(xiàn)實(shí)價值,表明具身智能在通用能力上仍有巨大提升空間。

    同時,實(shí)測數(shù)據(jù)顯示,參測模型雖具備較強(qiáng)的指令語義理解能力(呈現(xiàn)移動趨勢),但在精細(xì)操作任務(wù)中成功率不足 15%。這種現(xiàn)象在 RoboChallenge 平臺上沉淀了大量真機(jī)失敗數(shù)據(jù),這份公開的“錯題集”可作為模型迭代優(yōu)化的關(guān)鍵參考。

    RoboChallenge 標(biāo)為,未來將持續(xù)迭代,引入更多機(jī)器人本體類型,拓展至更多元化、更貼近真實(shí)工業(yè)與家庭需求的場景評測集,并設(shè)計更具挑戰(zhàn)性的任務(wù)。平臺還將探索分布式真機(jī)評測機(jī)制,進(jìn)一步擴(kuò)大測試規(guī)模與效率。

    【責(zé)任編輯:何思】
    中國日報網(wǎng)版權(quán)說明:凡注明來源為“中國日報網(wǎng):XXX(署名)”,除與中國日報網(wǎng)簽署內(nèi)容授權(quán)協(xié)議的網(wǎng)站外,其他任何網(wǎng)站或單位未經(jīng)允許禁止轉(zhuǎn)載、使用,違者必究。如需使用,請與010-84883777聯(lián)系;凡本網(wǎng)注明“來源:XXX(非中國日報網(wǎng))”的作品,均轉(zhuǎn)載自其它媒體,目的在于傳播更多信息,其他媒體如需轉(zhuǎn)載,請與稿件來源方聯(lián)系,如產(chǎn)生任何問題與本網(wǎng)無關(guān)。
    版權(quán)保護(hù):本網(wǎng)登載的內(nèi)容(包括文字、圖片、多媒體資訊等)版權(quán)屬中國日報網(wǎng)(中報國際文化傳媒(北京)有限公司)獨(dú)家所有使用。 未經(jīng)中國日報網(wǎng)事先協(xié)議授權(quán),禁止轉(zhuǎn)載使用。給中國日報網(wǎng)提意見:rx@chinadaily.com.cn
    C財經(jīng)客戶端 掃碼下載
    Chinadaily-cn 中文網(wǎng)微信
    ×
    主站蜘蛛池模板: 九九热九九热| 亚洲色成人网站www永久| 三级黄艳床上祼体式看| 亚色av| 国产精品区一区二| 日韩夜夜高潮夜夜爽无码| 黑人操日本女人| 91蝌蚪91九色白浆| xx性欧美肥妇精品久久久久久| 欧亚激情偷乱人伦小说专区| 日韩视频在线免费| 免费极品av一视觉盛宴| 亚洲国产日本韩国欧美mv| 亚洲综合在线视频自拍| 国产艳妇av在线出轨| 哪里有毛片看| 欧美疯狂性受xxxxx另类| 911精品国产一区二区在线| 亚洲九九热| 亚洲一区二区无码偷拍| 国产69囗曝吞精在线视频| 在线观看欧美日韩| 无码一区二区精品| 国产69精品久久久久人妻刘玥| 欧美亚洲日韩国产网站| av女大全列表| 成人在线高清视频| 狠狠的干性视频| 无码福利写真片视频在线播放| 性欧美4khd高清极品| 嫩草视频在线看| 麻豆丰满少妇chinese| 亚洲一本二卡三卡四卡乱码 | 精品无码人妻一区二区三区不卡 | 国产精品a免费一区久久电影| 国产精品色呦呦| 一区影视| 色欲欲www成人网站| 99亚洲精品卡2卡三卡4卡2卡| 久久国产精品77777| 日批免费在线观看|