查看内容

中美大模型26Q2展望：Scaling延续，Agent与多模态能力或成最大看点
== 2026/5/1 22:54:10 == 热度 190

模型值得重点跟踪。此外，Agent在办公等生产力场景的最新进展，亦是后续重要的观察维度。国产模型：技术创新推动Agent能力突破，持续追赶海外前沿；多模态经过多次迭代后应用生态逐步成熟，用户渗透加速，商业化有望迎来爆发。1）DeepSeek：开源模型长期引领者，V4通过多项技术创新实现Agent能力突破与成本优化。模型性能方面，首创mHC残差优化技术，能有效增强深层训练稳定性，提高长序推理表现，为更大规模模型奠定基础，V4参数量已达到1.6T，并支持1M上下文。推理成本方面，CSA+HCA等工程优化显著减少显存占用，实现低成本、高性能，限时优惠输出价格为6元/百万Token，为同级别模型价格最优；适配华为昇腾950PR等国产算力（核心股），有利于缓解算力制约、降低推理成本。2）Kimi：引入Agent集群架构，K2.6成为全球开源SOTA。月之暗面以长文本技术突破起家，已发展为国产大模型竞争的关键力量。Kimi K2.5实现重要演进：架构层面，创新Agent集群架构，通过调度多个Agent进行团队协作，大幅提升复杂任务处理效率；交互层面，突破了文字表达局限，延伸至图像等视觉内容理解；应用层面，掌握常用办公软件，表现出准专业水平的任务交付能力。Kimi K2.6能力继续迭代升级，成为开源SOTA，token调用量迅速攀升至OpenRouter平台首位，反映出强劲的技术竞争力和用户认可度。3）智谱：GLM-5.1领跑能力领先，Agent能力成为核心亮点。2026年2月11日和4月8日，智谱发布先后发布新一代旗舰模型GLM-5和GLM-5.1，聚焦Coding与Agent能力，在开源阵营中达到第一梯队，在核心工程能力上对齐甚至超越Claude Opus 4.6。GLM-5模型规模进一步扩张，总参数量提升至744B（激活参数40B），较上一代GLM-4.7的355B（激活参数32B）实现翻倍增长；预训练数据规模由23T提升至28.5T，在Scaling Law指引下带动性能持续跃升。后训练阶段，公司自研Slime异步强化学习框架，强化长链路任务处理能力，使模型在Agent场景中形成显著优势。4）Minimax：性价比优势凸显，M2.7开启自我进化。2026年2月12日和3月18日，MiniMax先后发布了新一代模型MiniMax M2.5和M2.7。在编程能力、工具调用和搜
=*=*=*=*=*=
当前为第2/5页
下一页-上一页-
=*=*=*=*=*=
返回新闻列表
返回网站首页