一次读完《三体》?DeepSeek-V4预览版上线,标配百万上下文能力
== 2026/4/24 14:17:54 == 热度 189
s 4.6思考模式存在一定差距。在世界知识测评中,DeepSeek-V4-Pro大幅领先其他开源模型,稍逊于顶尖闭源模型Gemini-Pro-3.1。而在数学、STEM、竞赛型代码的测评中,DeepSeek-V4-Pro超越当前所有已公开评测的开源模型,比肩世界顶级闭源模型。相比DeepSeek-V4-Pro,DeepSeek-V4-Flash在世界知识储备方面稍逊一筹,但展现出了接近的推理能力。而由于模型参数和激活更小,相较之下V4-Flash能够提供更加快捷、经济的API服务。在Agent测评中,DeepSeek-V4-Flash在简单任务上与DeepSeek-V4-Pro旗鼓相当,但在高难度任务上仍有差距。DeepSeek-V4还开创了一种新的注意力机制,在token维度进行压缩,结合DSA稀疏注意力(DeepSeek Sparse Attention),实现了全球领先的长上下文能力,并且相比于传统方法大幅降低了对计算和显存的需求。当前国内竞品多聚焦参数竞赛与短文本交互,长上下文能力普遍停留在128K-256K区间,且开源版本能力有限。而DeepSeek‑V4以“1M上下文+全开源+双版本+全接口兼容”的组合打法,实现差异化升级,也为全链条自主可控打下基础。东吴证券认为,DeepSeekV4在数学逻辑推理、专业代码编程、通用知识理解、智能体应用等通用大模型核心领域均实现突破性进展,综合能力全面超越当前海外主流顶级大模型,性能表现断层领先。而在训练架构上,DeepSeekV4开始明显转向适配国产算力,成为国产大模型拥抱国产算力的关键里程碑,相关算力标的有望受益。受DeepSeek‑V4预览版发布带动,国证半导体芯片指数今日强势上涨1.06%,成分股海光信息上涨6.43%,龙芯中科上涨5.87%,华润微上涨3.68%,中芯国际,圣邦股份等个股跟涨,半导体ETF鹏华上涨1.08%。值得一提的是,两天前,据媒体援引知情人士消息称,腾讯和阿里正在洽谈投资DeepSeek,DeepSeek目前正寻求以超过200亿美元估值筹集资金。不过,DeepSeek并未对此予以回应。
=*=*=*=*=*=
当前为第2/2页
上一页-
=*=*=*=*=*=
返回新闻列表
返回网站首页