查看内容

“价格屠夫”来了！DeepSeekV4把百万上下文打到2毛，适配华为昇腾，国产卡将“腰斩”API价格？
===2026/4/24 19:16:25===

开。”在业内人士看来，“此次V4模型的发布，更多的在于长文本能力的提升及价格的进一步下探。” 该人士感慨道：“此前DeepSeek-V3及R1模型发布后，其通过底层技术创新带来的性能优势，直接推动整个国内大模型行业集体降价，虽然此次V4版本每百万Tokens调用价格较国内同行并未下降太多，但依然具有竞争力，那个大模型价格屠夫又回来了！”。 “下半年批量上华为算力，Pro价格会大幅下调” 值得注意的是，在DeepSeek-v4公布API价格的信息的最下层位置，官方特别标注指出：“受限于高端算力，目前Pro的服务吞吐量十分有限，预计下半年昇腾950超节点批量上市后，Pro的价格会大幅下调。” 这意味着，此次发布的v4系列模型，已经针对华为昇腾950超节点完成适配，只要昇腾950上市，广大用户便可基于国产算力用上比肩国际顶级闭源模型的DeepSeek-v4。在官方开源的技术文档中，DeepSeek也提及了这一点，直言v4已在NVIDIA GPU和HUAWEI Ascend NPUs平台上验证了精细粒度的EP（专家并行）方案，相较于强大的非融合基线，其在通用推理任务上可实现1.50-1.73倍的加速效果，而在对时延敏感的场景（如RL推演和高速代理服务）中则可达到1.96倍的加速效果。而在V4发布后，华为昇腾也同步宣布“超节点全系列产品支持DeepSeek V4系列模型”。据悉，昇腾950通过融合kernel和多流并行技术降低Attention计算和访存开销，大幅提升推理性能，结合多种量化算法，实现了高吞吐、低时延的DeepSeek V4模型推理部署。本月上旬，英伟达创始人黄仁勋在接受Dwarkesh Patel专访时曾言：“如果DeepSeek先在华为平台上发布，那对我们国家（美国）来说将是灾难性的。”在黄仁勋看来，虽然DeepSeek是一款开源模型，同样可被用于英伟达产品上，但如果DeepSeek专门针对华为算力进行优化，在高端算力采购受限等局限下，英伟达将处于劣势。如今看来，虽然DeepSeek也针对英伟达算力进行了EP方案验证，但黄仁勋担心的事情还是发生了。在业内人士看来，“V4是算力博弈逼出来的产物，在未来一年，国产大模型跑在国产卡上，将逐渐成熟。” 多模态能力仍未出现比较遗憾的是，DeepSeek V4虽然发布
=*=*=*=*=*=
当前为第3/4页
下一页-上一页-
=*=*=*=*=*=
返回新闻列表
返回网站首页