2025OCP算力大会:超节点Scale Up架构引领AI数据中心新趋势
发布时间:
2025-10-22 15:23:13
来源: 保山日报网
本文作者:鲍奕龙
来源:硬AI
2025年OCP全球峰会传递出明确信号:以“Scale Up”(规模化扩展)架构为核心的AI数据中心基础设施建设正成为行业焦点。随着AI算力需求的爆发式增长,如何通过超节点架构实现更高密度、更高效率的计算,成为本次大会的核心议题。
四大技术趋势定义AI数据中心未来10月20日,摩根士丹利亚太团队发布研报指出,AI算力的无限需求正推动行业向更大规模、更高密度的“Scale Up”架构转型。投资焦点需从通用服务器组件转向超节点核心技术供应商。大会明确四大技术方向及关键受益者:
更大机柜: AMD Helios超宽机柜架构亮相,推动机柜组件升级,纬创(Wistron)和纬颖(Wiwynn)成为主要受益者。更高功率: 800V直流(VDC)供电方案成为下一代标准,台达电子(Delta)和贸联(BizLink)处于技术领先地位。更强冷却: 2兆瓦级(2MW)液冷分配单元(CDU)成为焦点,谷歌Deschutes方案备受关注。更快网络: 为AI优化的以太网(ESUN)和CPO交换机技术崭露头角,智邦科技(Accton)等厂商迎来升级机遇。行业正为吉瓦级AI数据中心集群做准备,能够提供高密度、高效率解决方案的企业将主导下一轮增长。
双倍宽度机架开启Scale Up新时代“Scale Up”架构通过提升单节点算力密度,推动机柜形态革命。AMD联合Meta、纬颖推出的Helios机柜采用ORW(Open Rack Wide)规格,宽度达传统ORV3机柜(21英寸)的两倍。
高性能芯片的浮点运算(FLOPs)密度极高,需在同一扩展域内连接更多计算核心。当前铜线连接的技术限制下,仅能通过更大的背板或中板实现,从而催生超宽机柜。
Meta认为,未来需实现解耦合设计,短期内机架功率密度将继续增加,但光学技术将最终取代铜互连。Helios机架计划于2026年下半年出货,主要客户包括Meta、甲骨文和OpenAI。
供应链调查显示,纬颖是Meta的主要ODM合作伙伴,纬创负责GPU模块、基板和交换机托盘生产,多数PCB需M9级CCL材料。超宽重型机柜对机械部件提出更高要求,勤诚(Chenbro)和川湖(King Slide)等供应商将受益。
800V直流电源架构驱动千兆瓦AI工厂随着机柜功率密度飙升,传统供电架构难以为继。800V直流(VDC)方案成为关键技术,其可在同等铜缆上传输超150%的电力,并将电源使用效率(PUE)提升约5%。
台达电子已展示成熟解决方案,包括1.2MW固态变压器(SST,已量产)、800V电子保险丝(eFuse)、90kW DC-DC电源架和12kW配电板。贸联等电源互连供应商将因液冷母线等严苛需求受益。
研报预计,800V直流方案将于2027年下半年随英伟达Rubin Ultra平台首次亮相。
大规模液冷系统成为散热核心散热是算力稳定输出的关键。大会展示的技术路径从混合散热向全液冷演进:
GB300现状: 已量产的GB300计算托盘采用85%液冷/15%风冷混合方案,每个托盘6组快换接头(QD),良率问题已解决。VR200前瞻: 下一代VR200平台将实现全液冷,每个托盘快换接头增至14组,预计2026年第三季度末交付。CDU大型化: 谷歌开源2兆瓦(MW)冷却液分配单元(CDU)设计,支持80 PSI压力,BOYD、酷冷至尊、台达电子和英维克均展示相关产品。Promersion预测,冷板技术仍是2030年前市场主流,但浸没式液冷的拐点预计在2028年出现。
网络技术优化应对AI集群需求除节点内部“Scale Up”扩展外,节点间高速互联(Scale Out)也是提升AI集群性能的关键。以太网解决方案(ESUN)和CPO交换机已广泛应用于AI数据网络优化,但可靠性、可维护性和成本仍是普及障碍。
智邦与天弘: 展示基于博通Tomahawk 6 ASIC的1.6T网络交换机,预计2026年底或2027年初应用。智邦还展示了CPO交换机概念验证。Meta研究: 51.2T CPO交换机年化链路故障率(ALFR)仅0.34%,远优于可插拔光模块的1.58%,但成本和可维护性需改进。有源电缆(AEC): 作为高性价比方案,在扩展网络中份额提升。Meta的GB300机柜已采用AEC,贸联等供应商将受益。2025年OCP全球峰会释放明确信号:AI基础设施的军备竞赛已进入“巨型化”阶段,规模化扩展成为核心主题。
来源:硬AI
2025年OCP全球峰会传递出明确信号:以“Scale Up”(规模化扩展)架构为核心的AI数据中心基础设施建设正成为行业焦点。随着AI算力需求的爆发式增长,如何通过超节点架构实现更高密度、更高效率的计算,成为本次大会的核心议题。
四大技术趋势定义AI数据中心未来10月20日,摩根士丹利亚太团队发布研报指出,AI算力的无限需求正推动行业向更大规模、更高密度的“Scale Up”架构转型。投资焦点需从通用服务器组件转向超节点核心技术供应商。大会明确四大技术方向及关键受益者:
更大机柜: AMD Helios超宽机柜架构亮相,推动机柜组件升级,纬创(Wistron)和纬颖(Wiwynn)成为主要受益者。更高功率: 800V直流(VDC)供电方案成为下一代标准,台达电子(Delta)和贸联(BizLink)处于技术领先地位。更强冷却: 2兆瓦级(2MW)液冷分配单元(CDU)成为焦点,谷歌Deschutes方案备受关注。更快网络: 为AI优化的以太网(ESUN)和CPO交换机技术崭露头角,智邦科技(Accton)等厂商迎来升级机遇。行业正为吉瓦级AI数据中心集群做准备,能够提供高密度、高效率解决方案的企业将主导下一轮增长。
双倍宽度机架开启Scale Up新时代“Scale Up”架构通过提升单节点算力密度,推动机柜形态革命。AMD联合Meta、纬颖推出的Helios机柜采用ORW(Open Rack Wide)规格,宽度达传统ORV3机柜(21英寸)的两倍。
高性能芯片的浮点运算(FLOPs)密度极高,需在同一扩展域内连接更多计算核心。当前铜线连接的技术限制下,仅能通过更大的背板或中板实现,从而催生超宽机柜。
Meta认为,未来需实现解耦合设计,短期内机架功率密度将继续增加,但光学技术将最终取代铜互连。Helios机架计划于2026年下半年出货,主要客户包括Meta、甲骨文和OpenAI。
供应链调查显示,纬颖是Meta的主要ODM合作伙伴,纬创负责GPU模块、基板和交换机托盘生产,多数PCB需M9级CCL材料。超宽重型机柜对机械部件提出更高要求,勤诚(Chenbro)和川湖(King Slide)等供应商将受益。
800V直流电源架构驱动千兆瓦AI工厂随着机柜功率密度飙升,传统供电架构难以为继。800V直流(VDC)方案成为关键技术,其可在同等铜缆上传输超150%的电力,并将电源使用效率(PUE)提升约5%。
台达电子已展示成熟解决方案,包括1.2MW固态变压器(SST,已量产)、800V电子保险丝(eFuse)、90kW DC-DC电源架和12kW配电板。贸联等电源互连供应商将因液冷母线等严苛需求受益。
研报预计,800V直流方案将于2027年下半年随英伟达Rubin Ultra平台首次亮相。
大规模液冷系统成为散热核心散热是算力稳定输出的关键。大会展示的技术路径从混合散热向全液冷演进:
GB300现状: 已量产的GB300计算托盘采用85%液冷/15%风冷混合方案,每个托盘6组快换接头(QD),良率问题已解决。VR200前瞻: 下一代VR200平台将实现全液冷,每个托盘快换接头增至14组,预计2026年第三季度末交付。CDU大型化: 谷歌开源2兆瓦(MW)冷却液分配单元(CDU)设计,支持80 PSI压力,BOYD、酷冷至尊、台达电子和英维克均展示相关产品。Promersion预测,冷板技术仍是2030年前市场主流,但浸没式液冷的拐点预计在2028年出现。
网络技术优化应对AI集群需求除节点内部“Scale Up”扩展外,节点间高速互联(Scale Out)也是提升AI集群性能的关键。以太网解决方案(ESUN)和CPO交换机已广泛应用于AI数据网络优化,但可靠性、可维护性和成本仍是普及障碍。
智邦与天弘: 展示基于博通Tomahawk 6 ASIC的1.6T网络交换机,预计2026年底或2027年初应用。智邦还展示了CPO交换机概念验证。Meta研究: 51.2T CPO交换机年化链路故障率(ALFR)仅0.34%,远优于可插拔光模块的1.58%,但成本和可维护性需改进。有源电缆(AEC): 作为高性价比方案,在扩展网络中份额提升。Meta的GB300机柜已采用AEC,贸联等供应商将受益。2025年OCP全球峰会释放明确信号:AI基础设施的军备竞赛已进入“巨型化”阶段,规模化扩展成为核心主题。
