查看内容

中科曙光发布国内首个AI计算开放架构，推动智算产业走向“安卓模式”
===2025-9-28 23:24:28===

一家领军企业选择“不建墙”，而是为整个AI计算产业“修路”。在2025世界智能产业博览会上，中科曙光协同AI芯片、AI整机、大模型等20多家产业链上下游企业，共同发布了国内首个AI计算开放架构。这一举动被产业界解读为国产计算产业向“安卓模式”开放的明确信号，旨在解决长期存在的算力资源割裂与协同难题。同期发布的曙光AI超集群系统，单机柜支持96加速卡、百P级AI算力，最大可实现百万卡大规模扩展。这套系统已在于9月15日启动的国家网络安全宣传周天津地区活动中亮相，展示其在网络安全智能化升级方面的应用潜力。产业困境国内AI算力领域长期面临高端算力供给不足、国产加速卡性能差距大、算力成本高、自主软硬件生态不成熟等严峻问题。各厂商技术自成体系、难以高效联动，不同厂商的服务器、芯片、存储与网络设备大多采用私有接口与协议，导致算力资源被分割在一个个“孤岛”上。这种技术路线上的不兼容，造成了大量的资源浪费和协同内耗。用户需要花费大量精力“重复造轮子”，宝贵的算力资源无法高效协同，整体上难以形成与外部成熟生态相抗衡的合力。架构突破 AI计算开放架构是面向大规模智能计算场景，以GPU为核心进行高效紧耦合系统设计的协同创新体系。该架构从“算、存、网、电、冷、管、软”单点突破走向集群创新，促进算力普惠。中科曙光首批开放了AI存储优化能力、液冷基础设施设计规范、DeepAI基础软件栈等三项技术能力，降低中小企业研发门槛。这套架构开放了五个层面的技术能力：部件级、系统层、基础设施层、软件层和数据集层。超集群系统基于AI计算开放架构设计的曙光AI超集群系统拥有“超高性能、超高效率、超高可靠、全面开放”四大特征。该系统可支持多品牌加速卡，并兼容CUDA等行业主流的软件生态，这意味着用户不必再被单一的技术路线绑定。曙光AI超集群系统具备121项设备和链路RAS可靠性设计，能够将平均无故障时间提升2.1倍，平均故障修复时间降低47%。该系统支持超30天长稳运行，并实现百万级部件故障自动分析与秒级隔离，全面保障智能安全系统的不间断稳定运行。性能表现在AI计算开放架构发布前，中科曙光于8月18日推出了国内首个行业标准化超智融合算力平台——Nebula800。该平台专攻智
=*=*=*=*=*=
当前为第1/2页
下一页-
=*=*=*=*=*=
返回新闻列表
返回网站首页