NVIDIA SANA-WM:2.6B 开源世界模型,单卡 H100 生成 1 分钟 720p 视频
世界模型(World Model)是 AI 领域一个比大语言模型更激进的概念:它不满足于「理解文字」,而是要在内部构建一个对物理世界运行规律的模拟器。大语言模型:学会的是「文字序列的统计规律」,输出文本世界模型:学会的是「视觉世界的因果规律」,预测下一帧画面SANA-WM 的独特之处在于,它不是传统的视频生成模型(如 Sora 或 Kling),而是以世界建模为目标的视频生成——模型必须理解物体怎么动、光影怎么变、相机移动时场景如何透视变化,才能生成连贯的分钟级视频。
小小测试开发2026-06-20 22:31:10