计算机行业周报:AI大模型持续更新,算力需求维持高景气
== 2025-4-3 12:47:57 == 热度 188
(以下内容从上海证券《计算机行业周报:AI大模型持续更新,算力需求维持高景气》研报附件原文摘录)市场回顾过去一周(3.24-3.28)上证综指下跌0.40%,创业板指下跌1.12%,沪深300指数上涨0.01%,计算机(申万)指数下跌4.89%,跑输上证综指4.49个百分点,跑输创业板指3.77个百分点,跑输沪深300指数4.90个百分点,位列全行业第31名。周观点AI大模型持续更新。(1)DeepSeek:3月24日,DeepSeek发布DeepSeek V3-0324模型,模型延续了V3系列的核心架构,即基于混合专家(MoE)模型设计。据悉,该模型拥有6710亿个总参数,每次推理激活其中的370亿参数,兼顾了计算效率与输出质量。此外,V3系列引入的多token预测(MTP)和无辅助损失负载均衡策略可能也在新版本中得到了进一步优化。主要更新亮点包括编码能力接近甚至部分超越了Claude3.5的水平,数学推理、创造性输出性能提升;用户体验优化更简洁高效;延续开源传统,采用了更宽松的MIT许可证;输出风格微调,输出语气更偏向技术化和正式化。(2)谷歌:3月25日,谷歌发布Gemini2.5Pro,延续前代模型的多模态能力和长上下文窗口特性,目前支持100万token的上下文窗口,相当于约75万字的内容,还引入了内置的“思考”能力,使其在复杂任务处理、推理能力和编程实力上达到了新的高度。性能方面,Gemini2.5Pro在LMArena排行榜所有分类中以显著优势位居榜首,超越了包括Anthropic的Claude3.5、OpenAI的GPT-4.5和o3-mini在内的众多竞品;在AIME2025(美国数学邀请赛)和GPQA(研究生级科学问答)等基准测试中,Gemini2.5Pro表现卓越;在编程方面,在SWE-Bench Verified上取得了63.8%的得分,显示出其在自主任务执行和代码生成上的强大能力。(3)OpenAI:3月26日,OpenAI推出GPT-4o原生图像生成功能。此次更新显著提升了对复杂指令的理解能力和图文混排渲染的可控性,尤其是在生成图像中的文字内容上,准确率大幅提升;支持多轮对话过程中连续地修改图像风格与构图元素,可以逐步调
=*=*=*=*=*=
当前为第1/3页
下一页-
=*=*=*=*=*=
返回新闻列表
返回网站首页