查看内容

DeepSeek和国产算力下了好大一盘棋
== 2026/4/27 15:51:15 == 热度 189

下的注意力运算。技术压缩效率，效率兑现成本。这才是DeepSeek敢于连续降价的真正底牌。理解了这一逻辑，便能看穿此次降价的产业含义：相比于其他（核心股）AI大模型降价拼命上桌，这一次DeepSeek直接用技术优势主动构建了成本壁垒。V4-Flash以0.02元/百万tokens的价格横扫市场背后，每一分钱的降价都有底层架构优化作为支撑，而不是资本烧钱补贴的逻辑。竞争对手要跟进，首先得在技术上追平这份效率而这显然不是一朝一夕之功。从模型等芯片，到芯片靠模型与两次降价几乎同步发生的，是国产芯片（核心股）阵营的集体起立。V4发布当日，华为昇腾、寒武纪、海光信息、摩尔线程、沐曦股份、昆仑芯、平头哥真武、天数智芯8家国产AI芯片（核心股）品牌，以及英伟达，均宣布完成对DeepSeek-V4的适配。尤其值得注意的是，这是大模型产业首次实现Day 0级别的全栈适配：模型发布即适配上线，芯片厂商不再需要数月的追逐式调试周期。这里有一个细节必须拆解清楚。DeepSeek官方在技术报告中表示，我们在英伟达GPU和华为昇腾NPU两个平台上验证了细粒度EP（专家并行）方案，在通用推理任务中实现1.50至1.73倍加速；在延迟敏感场景下最高达到1.96倍。这是DeepSeek历史上首次将国产芯片（核心股）与英伟达GPU并列写入硬件验证清单，确立对等地位。华为昇腾的反应也十分迅猛。昇腾官方在B站直播中称，在推理部署层面，昇腾950PR平台针对V4实现了多项深度适配。量化方面，原生的硬件加速精度明确支持MXFP8与MXFP4等低精度数据格式，兼顾模型精度与内存占用优化。算子层面，华为官方宣布昇腾950通过融合kernel与多流并行技术，大幅降低了混合注意力机制的计算和访存开销，显著提升了推理性能。而MoE模块中路由专家与共享专家的计算重叠等深度优化，则进一步确保了万亿参数模型在国产硬件上的高效平稳运行。图｜昇腾直播间截图寒武纪则在基于自研NeuWare软件生态与vLLM框架上，完成了对V4的Day 0适配并同步开源自研算子库。这已是寒武纪连续第二次在DeepSeek新模型发布首日便推出适配方案，其技术迭代速度同样不容小觑。更有说服力的信号来自财务上的持续好转，国产开源大模型的极速发展，正在把中国算力（核心股）产业拉入良性发展的通道里。4月26日晚，摩尔线程发布2026年一季报：一季度营业收入7
=*=*=*=*=*=
当前为第2/4页
下一页-上一页-
=*=*=*=*=*=
返回新闻列表
返回网站首页