斗鱼体育app中国官网下载 老黄吹的Cosmos 3, 在一个北大团队作念的榜单上拿了第一

刚刚曩昔的GTC Taipei上,最备受温暖的,莫过于Cosmos 3。

这是一个十足开源的物理AI全模态模子。老黄示意,Cosmos 3活着界生成这项上,在Artificial Analysis、Physics-IQ、PAI-Bench、R-Bench四个开源榜单上均列第一。

前三个bench都算业界比较眼熟的,而R-bench——我有益查了查,这个让Cosmos 3霸榜的榜单,竟出自一支北大团队。
这篇责任已被ICML 2026接受,名字叫《Rethinking Video Generation Model for the Embodied World》,来自北京大学、字节进步Seed等机构的讨论团队。
他们建议了面向具身寰球的视频生成评测与数据基础设施:R-Bench+RoVid-X。

值得防备的是,在作家列内外,字节Seedance 2.0的预查考庄重东说念主曾妍,也赫然在列。
R-Bench:专门给机器东说念主视频生成请的“考官”
Cosmos 3是英伟达此次GTC Taipei的主角之一。
按老黄的说法,它是人人首个十足开源的物理AI全模态模子,基于一种mixture-of-transformers架构,能在一个模子里同期相识和生成文本、图像、视频、环境声息,乃至机器东说念主的动作。
Nano和Super两个尺寸,都照旧挂上了Hugging Face。

换句话说,Cosmos 3要作念的不是“拍出悦目的视频”,而是给机器东说念主、自动驾驶这些要在确切寰球里干活的系统,生成“物理上说得通”的数据。
但问题它就来了。
一个模子生成的机器东说念主视频,到底是不是“物理上说得通”,该用什么来量度?
曩昔一年,视频生成的故事简直都绕着合并个问题伸开:谁能拍得更明晰、更巩固、更有电影感。
但在机器东说念主场景里,画质悦目是一趟事,能不成用又是另一趟事。
要是一个模子能生成传神的机械臂,却让夹爪穿过物体;能让机器东说念主看起来“动起来”,却无法完成抓取、抛弃、回身、合营等任务,那么它距离Physical AI需要的“寰球模子”,仍然隔着一条界限。
R-Bench的中枢起点,即是把视频生成模子从“视觉生成器”放到“物理寰球模拟器”的语境下再行评估。
它不单看画面是否传神,而是系统性量度模子是否能生成稳健具身任务逻辑和物理抑制的视频。

具体而言,R-Bench是一个以机器东说念主为中心的视频生成评测基准,包含650个图像-文本评测样本,从5类任务智商和4类机器东说念主形式两个维度构建。
在职务维度上,R-Bench袒护操作奉行、空间臆度、多主体合营、永劫方案和视觉推理;在机器东说念主形式维度上,袒护单臂、双臂、四足和东说念主形机器东说念主。

这么的策画让R-Bench不再只问“视频像不像”,而是进一步追问:
机器东说念主有莫得真确斗争到见解物体?
任务关键设施是否完满出现?
多个物体或多个主体之间的臆度是否合理?
机器东说念主形式在潜入经过中是否保持巩固?
永劫序动作是否稳健任务逻辑?
因此,R-Bench不仅仅一个名次榜,更可以算作机器东说念主视频生成数据的“物理质地过滤器”:
它能够评估生成视频是否满足斗争臆度、动作递次、形式巩固性和任务完成度等物理抑制,从而匡助筛选出更稳健物理轨则、可用于具身智能查考的数据。
为了捕捉这些问题,R-Bench策画了一套可复现的自动化评测方针体系,能够识别机器东说念主形式畸变、物体属性漂移、部件飘零或穿模、无斗争抓取、诬捏出现物体、关键动作缺失等常见失败模式。
值得防备的是,R-Bench的自动打分,和东说念主工评测的Spearman有臆度数达到0.96。

这意味着它不仅仅个自动跑分器具,在很猛进程上对皆了东说念主类对“物理合不对理”“任务完没完成”的判断。
榜单上还能看到什么?
在最新R-Bench Leaderboard中,Cosmos 3系列照旧成为开源社区最亮眼的模子之一。
Cosmos3-Nano以0.584的抽象得分位列RBench开源模子第一,Cosmos3-Super紧随其后,拿到0.581。

放到悉数榜单里看,这传递出两个信号。
一所以物理AI为见解查考的视频寰球模子,照旧启动在机器东说念主图像到视频生成上展现竞争。
比较传统通用视频模子,它的上风不单在画质,更在于更接近具身智能需要的物理模拟与动作延展智商。
二是闭源营业模子抽象智商仍然伊始,斗鱼体育app但开源正在快速追逐。
对讨论社区来说,这种“开源能打”的信号,比单个模子更强更繁多。

而比排名更有价值的,是RBench照出来的几处共性短板:
细腻操作照旧老浩劫。转移、回身这类大幅动作模子照旧作念得可以,但抓、持、拧、插、抛弃这些对斗争建模条件高的动作,最容易出错。
永劫方案仍是弱项。视频看起来连贯,不代表任务逻辑正确,模子可能动作畅通却漏掉关键设施,或者把递次搞反。
通用常识和机器东说念主数据没“合上”。纯通用视频有丰富的寰球常识但缺机器东说念主交互,纯机器东说念主数据又时时范围有限、形式单一。
从这个角度看,R-Bench更像一面镜子,把视频模子在物理寰球里的确切软肋照了出来。
RoVid-X:400万条机器东说念主视频,开源了
发现了问题,下一步即是喂数据。这恰是RoVid-X要不断的事。
团队照旧在Hugging Face上开源了RoVid-X的繁多子集(300万条机器东说念主视频),上线后热度攀升很快——它在Datasets Trending 的Video模态大范围数据皆集排名第一,在一齐6.5万多个Video模态数据集的举座Trending里也位列第九。
这反应了RoVid-X算作面向机器东说念主视觉/视频相识的大范围数据资源,在开源社区中的快速影响力。
数据集的完满版范围达到400万条机器东说念主视频片断、1300+细粒度手段、1万+小时本色,永别率720P,并附带RGB、深度、光流等多模态物理标注。

和通用互联网视频不同,RoVid-X要让模子斗争的是更接近确切的机器东说念主交互经过:物体若何被抓取、机械臂若何接近见解、任务若何被判辨、动作和环境若何共同变成物理抑制。
这种数据关于视频寰球模子尤其关键。因为物理相识不是简短靠指示词补出来的,而需要模子在宽敞交互数据中学习斗争、递次、力学臆度和结构巩固性。
施行限制也透露,引入RoVid-X数据后,模子在具身任务中的推崇能够取得巩固升迁。
举例在Wan系列模子上,经过RoVid-X微调后,模子在操作奉行、永劫方案和空间相识等维度均有显然改善。

这阐述高质地、结构化的机器东说念主视频数据,如实能够升迁视频生成模子面向具身场景的可奉行性与巩固性。
这项责任的酷爱酷爱,不单在于多了一个benchmark和一个dataset,而是把视频生成放进了物理AI的语境里再行注释。
曩昔视频生成更多做事于本色创作:告白、短片、殊效。往后,它可能成为机器东说念主查考、仿真环境构建和具身智能数据闭环的基础设施。
当模子启动相识斗争、递次、结构巩固性和动作后果,“生成一段看起来合理的视频”就在向“可用于物理寰球推演的寰球模拟引擎”围聚。
R-Bench和RoVid-X是在这个转向中补上两块关键拼图:一个回话“如何评估”,一个回话“如何查考”。
跟着Cosmos 3等Physical AI视频寰球模子干涉R-Bench榜单并取得开源Top-1,具身视频生成的竞争也正在从单纯比拼视觉效力,转向更接近确切寰球的物理相识和任务奉行智商。
关于开源社区而言,这粗略是一个更繁多的信号:Physical AI的进展,不单属于闭源模子和营业系统,也可以开采在敞开评测、敞开数据和敞开模子共同演化的基础之上。
按团队的方案,下一步还会去作念从生成视频反推可奉活动作的Inverse Dynamics Model,进一步买通视频生成、计谋学习和真机部署之间的闭环。
视频生成模子的下一站,粗略果然不仅仅拍电影,而是模拟、相识,并参与确切的物理寰球。
团队布景
这支团队叫DAGroup,来自北京大学,庄重东说念主是周大权。

周大权的经验,恰恰踩在此次责任的题眼上。
他从2022年就启动作念视频生成,是最早一批入场的东说念主之一——
代表作MagicVideo是业界最早的隐空间扩散视频模子之一,其后还有MagicVideo-V2、StoryDiffusion、Magic-Me等一系列责任。

在腾讯混元视频模子HunyuanVideo中,他领导了模子预查考与扩散算法策画团队。
更早之前,他在模子与硬件效力标的也颇有蕴蓄,Coordinate Attention曾被列为CVPR 2020最具影响力论文第2名。

如今回到北大作念助理评释,他把讨论重点放到了机器东说念主、AIGC和VLA上。
他自述,我方的讨论弥远带着一条“用最少的算力和内存,跑最强的算法”的干线。
除R-Bench/RoVid-X外,DAGroup还在鼓动HumanNet、StableVLA等多个具身与寰球模子标的的开源名堂。
论文地址:https://arxiv.org/abs/2601.15282
幸运飞艇app2026世界杯中国官方下载Project Page:https://dagroup-pku.github.io/ReVidgen.github.io/
GitHub地址:https://github.com/DAGroup-PKU/HumanNet
R-Bench Leaderboard:https://huggingface.co/spaces/DAGroup-PKU/Leaderboard
RoVid-X Dataset:https://huggingface.co/datasets/DAGroup-PKU/RoVid-X/斗鱼体育app中国官网下载