东方证券:推理开启OCS新空间 ASIC液冷逐步成标配
== 2026/4/29 11:01:57 == 热度 191
发布研报称,(L.US)v8t单个Cluster可扩展至超100万块芯片,Scale up+DCN持续带动OCS需求,v8i采用Boardfly架构印证OCS亦可用于市场广阔的MoE推理场景,打开需求天花板;ASIC芯片带来的液冷增量需求亦不可小觑,当下v8已全系标配液冷,随着芯片供给加速释放,液冷产业链有望持续维持高景气度。主要观点如下:v8t引入内存池化,单训练集群可扩展至超100万卡4月23日,发布新一代TPU包含v8t和v8i两款芯片。v8t作为训练芯片,旨在将模型开发从数月缩短至数周,单Pod可扩展至9600个芯片,单Pod FP4算力达121EFlops,较上一代提升近3倍,单芯片Scale up ICI速率提升至19.2Tb/s,较上一代翻倍,单芯片Scale out侧带宽提升至400Gb/s,并引入Virgo网络架构,采用扁平化双层无阻塞网络扩展,在单个网络结构中可连接超过13.4万块芯片,单个Cluster可扩展至超100万块芯片。v8t Scale up网络仍然采用3Dtorus+OCS互联,DCN网络采用OCS互联,随着集群规模迈入百万卡级,模型训练需求有望持续带动OCS互联需求。此外,v8t还引入了TPUDirect RDMA和TPUDirect Storage技术,使TPU内存与网络接口卡之间可直接数据传输,且TPU与高速管理存储之间也可直接访问。v8i采用Boardfly架构,OCS应用领域迈入推理侧v8i作为后训练和推理芯片,SRAM容量较上一代提升3倍,可容纳更大的KV缓存,显著减少长上下文decoding时的空闲时间,v8i采用Boardfly架构,相较3Dtorus架构显著减少网络直径至7跳,更适用于MoE推理。对于Boardfly架构,tray内4芯片采用ICI直连,每8个tray组成一个group,通过铜缆实现全互联,每36个group通过OCS互联形成1152个芯片的pod。部分投资者认为OCS应用领域相对局限于训练侧和DCN,而Boardfly架构印证了OCS亦可用于市场广阔的MoE推理场景,随着当下Openclaw、Coding需求持续提升,有望持续带动OCS伴随TPU在Anthropic、等模型厂商的后训练和推理场景的组网需求。全系液冷逐步成为新一代ASIC标配,液冷应用势不可挡TPUv8t和v8i风冷已无法支持,均采
=*=*=*=*=*=
当前为第1/2页
下一页-
=*=*=*=*=*=
返回新闻列表
返回网站首页