摩根大通:DeepSeek V3.2为中国AI市场带来第二波冲击 利好多数相关方
== 2025/12/5 10:46:39 == 热度 189
思考融入工具使用的模型,并且同时支持思考模式与非思考模式的工具调用。公司提出了一种大规模Agent训练数据合成方法,构造了大量难解答,易验证的强化学习任务(1800+环境,85,000+复杂指令),大幅提高了模型的泛化能力。 先前的模型V3.1主要针对英伟达CUDA进行了优化,而新模型V3.2/V3.2-Exp则为华为Ascend、寒武纪和海光提供了Day-0支持,并为SGLang、vLLM和其他推理框架提供了现成的内核,标志着明确转向国产硬件自主。
=*=*=*=*=*=
当前为第2/2页
上一页-
=*=*=*=*=*=
返回新闻列表
返回网站首页