中美大模型26Q2展望:Scaling延续,Agent与多模态能力或成最大看点
== 2026/5/1 22:54:10 == 热度 190
模型值得重点跟踪。此外,Agent在办公等生产力场景的最新进展,亦是后续重要的观察维度。国产模型:技术创新推动Agent能力突破,持续追赶海外前沿;多模态经过多次迭代后应用生态逐步成熟,用户渗透加速,商业化有望迎来爆发。1)DeepSeek:开源模型长期引领者,V4通过多项技术创新实现Agent能力突破与成本优化。模型性能方面,首创mHC残差优化技术,能有效增强深层训练稳定性,提高长序推理表现,为更大规模模型奠定基础,V4参数量已达到1.6T,并支持1M上下文。推理成本方面,CSA+HCA等工程优化显著减少显存占用,实现低成本、高性能,限时优惠输出价格为6元/百万Token,为同级别模型价格最优;适配华为昇腾950PR等国产算力(核心股),有利于缓解算力制约、降低推理成本。2)Kimi:引入Agent集群架构,K2.6成为全球开源SOTA。月之暗面以长文本技术突破起家,已发展为国产大模型竞争的关键力量。Kimi K2.5实现重要演进:架构层面,创新Agent集群架构,通过调度多个Agent进行团队协作,大幅提升复杂任务处理效率;交互层面,突破了文字表达局限,延伸至图像等视觉内容理解;应用层面,掌握常用办公软件,表现出准专业水平的任务交付能力。Kimi K2.6能力继续迭代升级,成为开源SOTA,token调用量迅速攀升至OpenRouter平台首位,反映出强劲的技术竞争力和用户认可度。3)智谱:GLM-5.1领跑能力领先,Agent能力成为核心亮点。2026年2月11日和4月8日,智谱发布先后发布新一代旗舰模型GLM-5和GLM-5.1,聚焦Coding与Agent能力,在开源阵营中达到第一梯队,在核心工程能力上对齐甚至超越Claude Opus 4.6。GLM-5模型规模进一步扩张,总参数量提升至744B(激活参数40B),较上一代GLM-4.7的355B(激活参数32B)实现翻倍增长;预训练数据规模由23T提升至28.5T,在Scaling Law指引下带动性能持续跃升。后训练阶段,公司自研Slime异步强化学习框架,强化长链路任务处理能力,使模型在Agent场景中形成显著优势。4)Minimax:性价比优势凸显,M2.7开启自我进化。2026年2月12日和3月18日,MiniMax先后发布了新一代模型MiniMax M2.5和M2.7。在编程能力、工具调用和搜
=*=*=*=*=*=
当前为第2/5页
下一页-上一页-
=*=*=*=*=*=
返回新闻列表
返回网站首页