查看内容

视频生成≠世界模型：当AI还在生成“天上飞的猪”，物理规律仍是最大短板
== 2026/6/13 10:29:06 == 热度 190

界模型行业仍处于非常早期的阶段。对于整个行业而言，比分类更重要的是世界模型核心范式的变革——从大语言模型时代的“下一个Token（词元）预测（NextTokenPrediction）”，演进到世界模型时代的“下一个物理状态预测（NextPhysicalStatePrediction）”。“人们看到杯子在桌边倾斜，就知道它可能掉下来摔碎。这种对真实物理世界的状态感知、规律理解、决策推演，就是未来世界模型需要具备的核心能力。”王仲远表示，目前大语言模型已经能在高考数学中拿到148分，能回答“铁碗不能放进微波炉”这类常识，但没有任何一个机器人的大脑能真正在物理世界中执行这些判断，这就是世界模型需要解决的核心问题。而要实现这一目标，行业仍需突破多重瓶颈。王仲远坦言，世界模型的数据肯定是缺乏的，特别是真实物理世界的数据，到底需要哪类数据大家还没找到路径。其次是评测体系缺失，现有评测多聚焦视频生成，无法衡量世界模型作为基座的核心能力。最重要的是技术路线尚未收敛，行业对如何训练世界模型未达成共识。未来三到五年都是世界模型持续演进的阶段。智能体落地：架构没有差距，瓶颈在基座与成本如果说世界模型是AI行业的下一代技术方向，那么智能体就是当下最火热的落地赛道。从去年开始，各类终端智能体、办公智能体、科研智能体产品层出不穷，但行业普遍的感受是“概念很美好，实际不好用”，真正能达到用户预期的产品寥寥无几。在王仲远看来，国内智能体的技术架构与国际顶尖水平并没有差距，用户觉得不好用的核心原因，从来都不是架构设计，而是背后的基座模型能力、运行成本与长期记忆能力。“中国在工程架构、场景应用上本来就是强项，很多时候大家觉得国产智能体体验不好，本质上是背后的基座模型还有差距，不是架构本身的问题。”他表示，现在智能体已经达到了可用甚至好用的水平，尤其是在信息调研、资料整理、报告撰写等场景，效率提升已经非常明显。他分享了自己的亲身经历：此前准备一份发言稿，自己花了好几个晚上整理的内容，用智能体5分钟就生成了质量几乎没有差别的版本，甚至数据细节比自己查得还要翔实。王仲远认为，智能体技术已经达到了提高生产效率，可用乃至好用上已经达到了很高的水平。但推广还需要一定周期，他分析智能体如果一个月要消耗几万甚至几十万元的Token，并不是每个人都能够负担；另外，很多智能体今天教的东西，过两天就忘了，没有长期记忆和持续
=*=*=*=*=*=
当前为第2/3页
下一页-上一页-
=*=*=*=*=*=
返回新闻列表
返回网站首页