logo
中科曙光发布国内首个AI计算开放架构,推动智算产业走向“安卓模式”
===2025-9-28 23:24:28===
  一家领军企业选择“不建墙”,而是为整个AI计算产业“修路”。  在2025世界智能产业博览会上,中科曙光协同AI芯片、AI整机、大模型等20多家产业链上下游企业,共同发布了国内首个AI计算开放架构。  这一举动被产业界解读为国产计算产业向“安卓模式”开放的明确信号,旨在解决长期存在的算力资源割裂与协同难题。  同期发布的曙光AI超集群系统,单机柜支持96加速卡、百P级AI算力,最大可实现百万卡大规模扩展。这套系统已在于9月15日启动的国家网络安全宣传周天津地区活动中亮相,展示其在网络安全智能化升级方面的应用潜力。产业困境  国内AI算力领域长期面临高端算力供给不足、国产加速卡性能差距大、算力成本高、自主软硬件生态不成熟等严峻问题。  各厂商技术自成体系、难以高效联动,不同厂商的服务器、芯片、存储与网络设备大多采用私有接口与协议,导致算力资源被分割在一个个“孤岛”上。  这种技术路线上的不兼容,造成了大量的资源浪费和协同内耗。用户需要花费大量精力“重复造轮子”,宝贵的算力资源无法高效协同,整体上难以形成与外部成熟生态相抗衡的合力。架构突破  AI计算开放架构是面向大规模智能计算场景,以GPU为核心进行高效紧耦合系统设计的协同创新体系。  该架构从“算、存、网、电、冷、管、软”单点突破走向集群创新,促进算力普惠。  中科曙光首批开放了AI存储优化能力、液冷基础设施设计规范、DeepAI基础软件栈等三项技术能力,降低中小企业研发门槛。  这套架构开放了五个层面的技术能力:部件级、系统层、基础设施层、软件层和数据集层。超集群系统  基于AI计算开放架构设计的曙光AI超集群系统拥有“超高性能、超高效率、超高可靠、全面开放”四大特征。  该系统可支持多品牌加速卡,并兼容CUDA等行业主流的软件生态,这意味着用户不必再被单一的技术路线绑定。  曙光AI超集群系统具备121项设备和链路RAS可靠性设计,能够将平均无故障时间提升2.1倍,平均故障修复时间降低47%。  该系统支持超30天长稳运行,并实现百万级部件故障自动分析与秒级隔离,全面保障智能安全系统的不间断稳定运行。性能表现  在AI计算开放架构发布前,中科曙光于8月18日推出了国内首个行业标准化超智融合算力平台——Nebula800。  该平台专攻智
=*=*=*=*=*=
当前为第1/2页
下一页-
=*=*=*=*=*=
返回新闻列表
返回网站首页