首页 > 新车测评 > 新车测评 > VerseCrafter:给视频世界模型装上4D方向盘,精准运镜控物

VerseCrafter:给视频世界模型装上4D方向盘,精准运镜控物

发布时间:2026-01-19 21:06:58来源: 15210273549

频世界模型领域又迎来了新的突破!

复旦大学与腾讯 PCG ARC Lab 等机构的研究者们提出了 VerseCrafter,这是一个通过显式 4D 几何控制(4D Geometric Control)实现的动态逼真视频世界模型。它不仅能像「导演」一样精准控制运镜,还能同时指挥场景中多个物体的 3D 运动轨迹,为视频生成引入了物理世界维度。

自 Sora 问世以来,视频世界模型(Video World Models)成为了 AI 领域最热门的研究方向之一。我们希望 AI 不仅能生成视频,更能理解和模拟真实的物理世界。然而,现有的视频模型往往面临一个核心困境:视频是在 2D 平面上播放的,但真实世界是 4D(3D 空间 + 时间)的。

现有的方法(如 Voyager、Yume 等)虽然引入了 3D 几何结构来辅助生成,但往往难以在一个统一的框架下同时实现精准的相机控制和多物体运动控制。要么是控制了镜头但物体不动(静态场景),要么是控制了物体但镜头受限,或者依赖于刚性的 3D 边界框和人的参数化模型(如 SMPL),难以应对复杂的真实世界物体。

为了打破这一僵局,来自复旦大学、上海创智学院、香港大学和腾讯 PCG ARC Lab 的研究团队提出了 VerseCrafter。

新车测评更多>>

麒麟9030+红枫四摄!华为新机曝光:3月正式发布 苹果联合人大发布VSSFlow模型:无声视频AI同步生成音效与配音 中国“英伟达”诞生!拥有100%全自研技术,国产替代即将崛起! 继续为AI雄心筹资!兜售200亿美元债后,谷歌(GOOGL.US)再发英镑与瑞郎债 NEXON游戏《潜水员戴夫》中国上线登顶付费榜 在App Store夺冠 苹果推出丙午马年新春特别企划 多元体验筑造浓浓年味 得物App推出AR试穿试戴、3D陀螺仪、寻香助手等创新功能 60秒出电影级成片!Seedance2.0引爆AI视频,机遇与争议并存 4字头的iPhone17来了!免税版国行iPhone,首次现身珠海 中国信通院:2025年国内市场手机出货量3.07亿部,同比下降2.4% 2025年全球智能手机市场微增2%,苹果三星领跑,华为国内重登榜首 单季狂赚3000亿;iPhone 17 全球卖疯了!苹果用最\"狠\"业绩回击一切质疑 从上春晚到撒15亿,腾讯、宇树们血拼春节档? 阿里加入春节红包大战,千问APP计划向用户派发上亿红包 VerseCrafter:给视频世界模型装上4D方向盘,精准运镜控物 全球首个GW级算力集群!马斯克宣布xAI旗下Colossus 2投入运行,距离开工建设不到1年! 甘肃退伍老兵,抱紧黄仁勋,狂揽上千亿 两部门:商业用房(含“商住两用房”)购房贷款最低首付款比例调整为不低于30% 股海导航_2026年1月19日_沪深股市公告与交易提示 国泰海通证券:维持优然牧业“增持”评级 大股东定增彰显信心 机器人最快千亿独角兽诞生!黄仁勋投了 技术鱼池充分证明比亚迪技术一直走在市场前面 回老家过年,男生开什么车有面?20万预算建议选这3款 “蹭热点式”布局“脑机接口”业务?亚辉龙遭监管警示 黄金、白银直线拉升!发生了什么? 安装空调更省心 小米宣布数字抽真空服务覆盖7省级行政区 衡水枣强县大营镇:AI设计皮草有了版权“护身” 荣耀X80曝光:万级电池手机、千元档位 春节前推出 荣耀Magic8 RSR保时捷设计爆料 谷歌Gemini和苹果的顶级华人科学家离职创业,剑指AGI