1. 黄色视频软件大全,黄色视频网站APP,黄色视频免费观看下载,黄色视频污在线观看网站

          網站地圖
        2. 世界模型新突破!LEwin樂玩機器人開源EVAC框架與EWMBench評測基準 發布時間:2025-05-22 17:09:39

          導 言 

          當前具身智能研發正麵臨“雙重枷鎖”:一方麵,真機驗證成本高、仿真偏差大,製約策略驗證效率;另一方麵,海量真機數據尚未構建基於軌跡擴增的高效利用機製,導致數據未被充分利用,製約了模型的持續進化。為打破這一困局,LEwin樂玩機器人在去年發布的具身4D世界模型基礎上【點擊文字回顧相關內容】,進一步創新迭代,推出動作序列驅動的世界模型框架 EVAC(EnerVerse-AC),同時配套提出全球首個具身世界模型評測基準 EWMBench,構建從世界模型從訓練到評測的全鏈路閉環。另外,這兩大創新成果現已全麵開源,EVAC也成為全球頂尖機器人賽事 AgiBot World Challenge @ IROS 2025【點擊文字跳轉相關文章】 的baseline之一。


          近日,LEwin樂玩機器人重磅發布具身智能領域雙重裏程碑式突破:全球首個基於機器人動作序列驅動的具身世界模型EVAC (EnerVerse-AC),以及具身世界模型評測基準EWMBench。這兩大創新成果現已全麵開源,旨在構建“低成本模擬 - 標準化評測 - 高效迭代”的全新開發範式,持續賦能全球具身智能研究,加速技術落地與產業發展。


          EVAC arxiv:

          http://arxiv.org/abs/2505.09723

          ?EVAC 開源代碼:

          http://github.com/AgibotTech/EnerVerse-AC

          EWMBench arxiv:

          http://arxiv.org/abs/2505.09694

          ?EWMBench 開源代碼:

          http://github.com/AgibotTech/EWMBench



          直麵行業瓶頸

          破解具身智能研發的 “雙重枷鎖”


          當前具身智能演進麵臨兩大關鍵製約:在測試階段,真機驗證代價大、風險高,仿真係統又受製於虛實偏差;在數據層麵,海量真機數據尚未構建基於軌跡擴增的高效利用機製,限製了多樣性生成與泛化訓練。為打破困局,LEwin樂玩機器人依托深厚的技術積累,精準洞察行業痛點,在去年發布的世界模型架構EnerVerse基礎上推出創新成果:基於動作序列驅動的世界模型 EVAC與具身世界模型評測榜單 EWMBench,構建從訓練到評測全鏈路技術閉環,重新定義具身智能研發範式。


          技術突破:EVAC—— 

          全球首個機器人動作序列驅動的世界模型


          EVAC 是一個能夠動態複現機器人與環境複雜交互的世界模型,標誌著從傳統仿真到生成式模擬的躍遷。

          1.png


          ▍核心能力:從 “物理執行” 到“像素空間”的精準映射

          EVAC基於前序工作 EnerVerse 架構持續演進,創新型引入多級動作條件注入機製,實現 “物理動作 - 視覺動態” 的端到端生成,其核心能力體現在以下幾個方麵:


          2.png


          • 機器人動作與像素的高精度對齊:將機械臂 6D 位姿(x,y,z,roll,pitch,yaw)與末端執行器行程投影為action map,確保物理動作與圖像幀的像素級對齊,精準建模 “抓取”、“放置”、“碰撞”、“推拉”、“快速拋擲”、“緩慢搖晃” 等複雜動力學行為;

          • 動態多視圖建模:引入Ray Map編碼相機運動軌跡,支持頭部 、腕部等多視角協同生成一致且連貫的視覺場景,賦予機器人更全麵的環境生成能力。;

          • 卓越的長時序一致性:采用 Chunk-Wise 自回歸擴散架構與稀疏記憶機製(Sparse Memory),EVAC能夠實現單視圖穩定生成長達 30 個連續片段、多視圖下亦可維持 10 個連續片段的無漂移穩定輸出,保證了模擬過程在時間軸上的連貫性與真實性;

          • 數據高效利用:融合 Agibot-World 數據集 + 失敗軌跡(如抓取滑脫、路徑碰撞)提升生成質量,該策略能有效抑製幻覺現象,使模型能更合理、更全麵地建模機器人與環境的交互動態。



          ▍雙重價值:生成式仿真評估+數據引擎雙輪驅動

          生成式仿真評測:

          針對真機評測成本高、風險大、難以複現等痛點,EVAC開創性地提出了生成式模擬評測方案,它能與待評測的策略模型進行交替推理,構建起一套完整的交互式評測管線。實驗顯示,在多個任務中,EVAC所生成的評測結果與真機評測的成功率具有高度一致性,甚至能夠可靠地識別出性能更優的模型權重,大幅提升了策略模型的篩選效率。


          4.png


          數據增廣引擎:

          EVAC 能夠基於極少量的專家軌跡數據,通過動作插值與高保真畫麵生成技術進行大規模數據增廣。應用結果表明,采用EVAC數據增廣數據訓練的策略模型,其任務成功率提升高達29%,目標跟隨性得到顯著改善,驗證了這一方案在具身智能研究中的實用性與高性價比。


          7.png


          具身世界模型評測基準

          EWMBench——打造具身世界模型的 

          “質檢尺”

          為了科學、係統地衡量具身世界模型的性能表現,LEwin樂玩機器人推出了全球首個具身世界模型評測基準——EWMBench,旨在填補行業空白,構建統一、可信的評測標準。


          8.jpg


          ▍三維度評估體係:場景 × 動作 × 語義的立體考核

          針對機器人操作場景的複雜性與特殊性,EWMBench構建了立體化的評估體係,從場景一致性、動作合理性 與 語義對齊與多樣性 三大核心指標進行分析:

          場景一致性Scene Consistency:

          評估生成場景中背景/物體/視角等穩固度與真實性,采用微調過的DINOv2特征進行量化。

          動作合理性Motion Correctness:

          利用HSD (Symmetric Hausdorff Distance), nDTW (normalized Dynamic Time Warping) 和 Dynamics Score 三重互補指標協同精確評估生成動作的合理性與動力學真實度。

          語義對齊與多樣性Semantic Alignment & Diversity:
          結合MLLM(多模態大模型)和CLIP從全局指令對齊度、關鍵步驟語義準確性、邏輯合理性等多個層次對生成視頻進行語義理解評估。


          9.jpeg


          ▍權威數據支撐與便捷開源工具

          • 基準數據集:EWMBench 基於行業領先的開源百萬真機數據集 Agibot-World 構建,涵蓋了家居、工業、醫療三大場景的 10 類典型機器人操作任務和剛體 / 柔體 / 流體 / 關節物體等多種交互對象,其中包含超過 300個精心設計的測試樣本及 30% 挑戰性場景(低光照 / 部分遮擋),全麵驗證模型在複雜環境下的魯棒性。

          • 開源評測工具:LEwin樂玩機器人同步開源了全流程評測工具,支持一鍵生成標準化對比報告,大幅降低評估門檻,方便研究者快速開展模型比較與性能分析,加速實驗驗證與成果複現。


          ▍卓越評測性能:更貼近人類主觀感知


          10.png


          相較於當前主流視頻生成評測基準 VBench,EWMBench 在評測結果與人類主觀判斷的一致性方麵表現更優,能夠更真實、細致地反映具身世界模型在交互理解、動作還原與視覺一致性等核心維度的實際能力。


          協同效應:

          EnerVerse X EVAC × EWMBench 的

           “螺旋進化”


          EnerVerse 作為強大的世界模型基礎架構,為 EVAC 提供可靠的基礎框架與預訓練能力,而 EVAC 生成的多樣化高質量數據又能反哺 EnerVerse 模型的持續優化,二者形成 “訓練 - 驗證” 技術閉環,不斷推動模型性能突破。通過 EWMBench 提供的精細化、多維度量化分析,研發團隊可以精準定位 EVAC 在處理如 “多物體交互”“動態環境避障” 等複雜場景的潛在不足,從而進行更具針對性的優化。


          EVAC 與 EWMBench 組合方案,已正式入選 AgiBot World Challenge @ IROS 2025 – World Model賽道的官方基線係統與評測標準。對於致力於具身智能世界模型研究的開發者和團隊而言,提供了一個寶貴的實踐與驗證平台。黄色视频软件大全鼓勵有興趣的同行關注並參與此項挑戰賽。參賽者將有機會:利用EVAC開源代碼與模型權重,訓練、調優具身世界模型;通過EWMBench全麵的評測維度和標準化工具,客觀評估其世界模型的性能;在統一的基準下與全球研究者交流、比較和迭代各自的創新方法。AgiBot World Challenge @IROS 2025旨在促進具身智能領域的前沿探索與技術交流,期待通過這一平台見證更多富有創造力的成果。


          具身世界模型 EVAC和具身世界模型評測基準 EWMBench的發布和開源,將全麵破解模型評測成本高和數據價值未充分挖掘利用的行業痛點,標誌著具身智能進入“算法 - 評測” 協同進化時代。LEwin樂玩機器人也將持續踐行具身智能生態發展的創新和協作,持續推動前沿技術開源,引領具身智能邁向更高效、更普適的未來。

          網站地圖