logo
“价格屠夫”来了!DeepSeekV4把百万上下文打到2毛,适配华为昇腾,国产卡将“腰斩”API价格?
===2026/4/24 19:16:25===
开。”在业内人士看来,“此次V4模型的发布,更多的在于长文本能力的提升及价格的进一步下探。”   该人士感慨道:“此前DeepSeek-V3及R1模型发布后,其通过底层技术创新带来的性能优势,直接推动整个国内大模型行业集体降价,虽然此次V4版本每百万Tokens调用价格较国内同行并未下降太多,但依然具有竞争力,那个大模型价格屠夫又回来了!”。   “下半年批量上华为算力,Pro价格会大幅下调”   值得注意的是,在DeepSeek-v4公布API价格的信息的最下层位置,官方特别标注指出:“受限于高端算力,目前Pro的服务吞吐量十分有限,预计下半年昇腾950超节点批量上市后,Pro的价格会大幅下调。”   这意味着,此次发布的v4系列模型,已经针对华为昇腾950超节点完成适配,只要昇腾950上市,广大用户便可基于国产算力用上比肩国际顶级闭源模型的DeepSeek-v4。   在官方开源的技术文档中,DeepSeek也提及了这一点,直言v4已在NVIDIA GPU和HUAWEI Ascend NPUs平台上验证了精细粒度的EP(专家并行)方案,相较于强大的非融合基线,其在通用推理任务上可实现1.50-1.73倍的加速效果,而在对时延敏感的场景(如RL推演和高速代理服务)中则可达到1.96倍的加速效果。   而在V4发布后,华为昇腾也同步宣布“超节点全系列产品支持DeepSeek V4系列模型”。据悉,昇腾950通过融合kernel和多流并行技术降低Attention计算和访存开销,大幅提升推理性能,结合多种量化算法,实现了高吞吐、低时延的DeepSeek V4模型推理部署。   本月上旬,英伟达创始人黄仁勋在接受Dwarkesh Patel专访时曾言:“如果DeepSeek先在华为平台上发布,那对我们国家(美国)来说将是灾难性的。”在黄仁勋看来,虽然DeepSeek是一款开源模型,同样可被用于英伟达产品上,但如果DeepSeek专门针对华为算力进行优化,在高端算力采购受限等局限下,英伟达将处于劣势。   如今看来,虽然DeepSeek也针对英伟达算力进行了EP方案验证,但黄仁勋担心的事情还是发生了。在业内人士看来,“V4是算力博弈逼出来的产物,在未来一年,国产大模型跑在国产卡上,将逐渐成熟。”   多模态能力仍未出现   比较遗憾的是,DeepSeek V4虽然发布
=*=*=*=*=*=
当前为第3/4页
下一页-上一页-
=*=*=*=*=*=
返回新闻列表
返回网站首页