logo
一次读完《三体》?DeepSeek-V4预览版上线,标配百万上下文能力
== 2026/4/24 14:17:54 == 热度 190
4月24日,DeepSeek全新一代模型DeepSeek-V4预览版正式上线并同步开源。该模型拥有百万字超长上下文,在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先。昇腾超节点全系列产品支持DeepSeek V4系列模型。此次发布的DeepSeek-V4预览版提供Pro与Flash两大版本,均标配百万字(1M)上下文能力,打破长文本处理的场景限制。新版本同时支持思考模式切换、Json输出、工具调用、对话前缀续写等企业级功能,FIM补全功能在非思考模式下可正常使用,可覆盖开发、办公、法律、金融等复杂场景需求。若以1M Token的上下文窗口等效于一次性处理75万字的中文内容计算,百万字上下文能力,大约相当于一次性读完《三体》三部曲的体量。DeepSeek方面公布的参数显示,DeepSeek‑V4‑Pro激活参数49B、预训练数据33T,定位高性能旗舰;DeepSeek‑V4‑Flash激活参数13B、预训练数据32T,主打高速与低成本。DeepSeek-V4的API服务信息也同步更新。其兼容OpenAI与Anthropic两大标准接口,开发者仅需修改model_name为deepseek-v4-pro或deepseek-v4-flash即可快速调用。原有DeepSeek‑chat与DeepSeek‑reasoner接口将在3个月后正式停用,现阶段自动映射至Flash版本,以降低迁移成本。定价体系上,DeepSeek‑V4延续普惠路线。Flash版缓存命中输入每百万Token仅0.2元、未命中1元、输出2元;Pro 版缓存命中1元、未命中12元、输出24元。DeepSeek方面提示,受限于当前高端算力,Pro版服务吞吐有限,而随着下半年昇腾超节点全系列产品批量上市,Pro版价格有望大幅下调,进一步释放高性能AI的普惠空间。与前代模型比较,DeepSeek-V4-Pro的Agent能力显著增强。在Agentic Coding评测中,V4-Pro已达到当前开源模型最佳水平,并在其他Agent相关评测中同样表现优异。据悉,目前DeepSeek-V4已成为DeepSeek内部员工使用的 Agentic Coding模型,据评测反馈使用体验优于Sonnet 4.5,交付质量接近Claude Opus 4.6非思考模式,但仍与Opu
=*=*=*=*=*=
当前为第1/2页
下一页-
=*=*=*=*=*=
返回新闻列表
返回网站首页