半导体行业深度报告(十二):AI大模型竞赛方兴未艾,OpenAI与DeepSeek引领行业生态重构
== 2025-3-28 16:44:17 == 热度 195
供给格局看,大模型竞争日趋白热,模型之间差距逐步缩小,护城河不清晰,厂商需要持续大量投入,海内外竞争格局都将逐步收敛至头部厂商,部分规模较小的模型厂商或聚焦于垂直化的细分场景。GPT与OpenAI o1系列模型分别验证了算力投入在训练侧和推理侧的重要性,而DeepSeek通过创新性的训练方法和架构实现了较低的模型训练成本,在未来大模型不断创新迭代的背景下,性能提升与成本下行或成为两条重要主线。基于GPT-3.5的ChatGPT的发布推动了AI技术的普及和AI产业的变革,是人工智能的重要里程碑之一。ChatGPT的创始人OpenAI自成立起先后发布了GPT系列模型和以OpenAI o1、o3为代表的深度推理模型,GPT系列模型注重预训练阶段的Scaling Law,整体来说更适合解决通识类知识,目前已经迭代至GPT-4系列,从最初单一的文本模态迭代成为多模态大模型,参数规模、训练数据、上下文窗口大小相比前代呈指数级增长,模型性能相应也有显著提升。OpenAI o1模型引入了思维链,证明了推理侧的算力资源投入同样重要,Scaling Law在推理阶段或同样适用,未来,GPT系列与o1为代表的深度推理系列模型或将互相补充。近期,DeepSeek大模型的发布进一步拉动了AI热潮,DeepSeek-R1发布后仅用七天用户增长一亿,海内外头部厂商纷纷入场布局。DeepSeek-V3性能对齐海外领军闭源模型,但依靠引入MLA机制和创新性的DeepSeekMoE架构实现了远低于行业平均的训练成本和定价。DeepSeek-R1在后训练阶段大规模使用了强化学习技术而不依赖监督微调,性能对齐OpenAI-o1正式版,同时证明了蒸馏技术能够将大模型的推理能力转移到更小的模型上,提升它们的表现。投资建议:AI大模型时代下,AI算力需求高速扩张,从而驱动AI芯片、存储、服务器、光模块、PCB等上游产业链半导体板块的需求快速增长,相关标的有望长期受益。(1)云端AI芯片板块关注寒武纪、海光信息、龙芯中科等;(2)端侧AI芯片板块关注恒玄科技、乐鑫科技、中科蓝讯、晶晨股份、瑞芯微、全志科技、炬芯科技、国科微等;(3)存储板块关注兆易创新、佰维存储、德明利、江波龙、澜起科技、东芯股份、聚辰股份、普冉股份、北京君正等;(4)光模块、光器件、光芯片板块关注中际旭创、天孚通信、新易盛、光迅科技、源杰科技等
=*=*=*=*=*=
当前为第2/3页
下一页-上一页-
=*=*=*=*=*=
返回新闻列表
返回网站首页