未来数据中心的5个优化方向

发布时间 : 2022-05-19

    随着数字经济对社会发展的影响逐步加深,数字产业及数字基础设施建设的重要性日益凸显。年初,国家发改委等四部门批复同意京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏等八个地区启动国家算力网络枢纽节点建设,“东数西算”工程正式启动,全国一体化大数据中心创新体系的整体布局进入了落地阶段。


 与此同时,数据中心建设浪潮的到来也加大了对能源、环境的压力。陈彦灵引用数据表示,2021年,国内数据中心总耗电量达到2166亿千瓦时,占社会用电量2.6%,相当于同年1.3个上海市的总社会用电量。预计到2030年,中国数据中心总耗电量将达到5915亿千瓦时,占全社会用电量的5%。


 国家启动“东数西算”工程以及发布系列指引政策,着眼全国数据中心产业整体发展,优化产业布局,引导产业绿色、高效、低碳。特别是在“双碳”目标之下,国家明确要求未来全国新建数据中心的PUE降到1.3以下,国家枢纽数据中心PUE降低到1.25以下,逐步对PUE超过1.5的数据中心进行节能降碳改造。


 不仅仅是国内,数据中心产业的绿色发展已经引起了全球产业的重视,绿色集约将成为数据中心发展的主流方向。第三方数据显示,超大规模数据中心将从2019年的512个增长到2021年的691个,而数据中心的数量也从2019年的42.9万个降低到2021年的41.5万个。


 在这一背景下,数据中心产业面临着产业环境、技术手段、市场需求的多方面变革。陈彦灵表示,浪潮信息根据多年来的数据中心服务经验,以及发展中遇到的产业问题,进行分析、归类、凝练,最终提出了面向未来数据中心的5个优化方向。


超大规模数据中心快速增长运维管理亟需智能化升级


 根据经验,一个运维人员的运维上限约为400台设备。随着数据中心向大型化、超大型化发展,动辄数十万台服务器的数据中心则需要数百个运维人员——这不仅造成组织架构的复杂和成本的增加,运维效率和精准度也会快速下降。 


 因此,陈彦灵认为未来数据中心运维效率提升的方向是标准化、自动化、可视化以及智能化。建立开放、标准的数据接口和协议,实现平台归一化和安全化;通过自动化运维减少人工操作,提升运维效率;通过数字孪生技术,可以实现运维的可视化;通过智能化手段可以快速定位故障并快速对维修方案进行预判。


 浪潮信息构建了标准、开放、智能的运维方案,助力数据中心跨平台高效运维。在硬件管理上,浪潮提供了OpenBMC、OpenRMC等开放的管理方案,在监控协议层面,浪潮信息可以提供标准的Redfish、IPMI、SNMP等标准协议,通过ISPIM平台对外提供标准的用户接口以及第三方平台访问接口,可以实现无侵入带外管理、自动化资产管理、数字孪生可视化管理等方案,管理规模可以达到十万台以上。目前该方案已经在金融、通信、能源以及互联网等多个行业进行了部署,整体管理效率提升了10倍以上。


交付规模井喷整机柜实现数据中心大规模快速交付


 不同规模的用户对交付周期会有不同的要求,大型互联网用户高峰期日交付量超1万台,普通传统用户的高峰期日交付也会超5000台。如果采用单节点交付方式,每人每天大概可以交付12台左右,远远无法在交付窗口期完成设备交付。


 由开放计算发展而来的整机柜交付是解决这一问题的最佳方案。浪潮信息的测试对比显示,按照1500台设备计算,采用单节点交付大概需要125人/天、整机柜不带交换机交付大概需要45人/天、整机柜带交换机交付需要25人/天。整机柜交付相比传统的交付模式,整体交付效率可以提升5倍。集成度越高,交付时间越短,交付成本越低。


 浪潮信息从2010年起开始整机柜系统的研制和交付工作,具有多年的沉淀和技术积累。目前面向超大规模、大规模数据中心可以提供多种方案,整体的交付效率可以提升5~10倍,同时还可以解决整机柜服务器节点搬迁的问题。在实际落地中,浪潮信息更是通过整机柜完成了8小时1万台服务器的上架交付的行业记录。此外,浪潮信息还提供模块化数据中心解决方案,通过模块化的预制工艺,可以使数据中心建设周期缩短50%以上。



算力基础设施能耗加速增长供电散热亟需绿色创新

 

“降低PUE已经成为客户对数据中心的基本需求。”陈彦灵表示。


 从目前看,降低数据中心的PUE,减少制冷电力消耗是核心方向。通过中压直供、间接蒸发冷却、集中供电等方式可以实现数据中心40%以上的能耗节约,以1万台服务器的数据中心为例,采用这些节能技术,一年可以减少近5万吨的二氧化碳排放。而从当前的技术方案来看,只有通过液冷方式才可以把数据中心的PUE降低到1.2以下。


 在IPF2022大会上,浪潮信息携手京东云共同发布了天枢(ORS3000S)液冷整机柜服务器。该产品是面向新一代绿色数据中心所构建的支持冷板式液冷散热、集中供电,可实现一体化交付的整体解决方案。通过高压直流供电,可以降低数据中心供电损耗3%以上,通过柜级液冷可以将50%的热量通过液体带走,降低风扇及空调电力消耗,可以降低数据中心能耗36%以上。通过集中供电、动态的电源管理、前置IO架构,可以带来近10%的电力节约,可以实现原生的液冷部署,实现数据中心累计能耗40%以上的降低。除了整机柜液冷服务器外,浪潮还提供了面向现有数据中心的液冷改造方案,可以实现累计功耗10%~40%的降低。



数实相融催生多元计算场景算力基础设施多元化趋势明显


 在智慧时代,计算场景呈现多元化,大数据、AI推理、AI训练、关键计算、科学计算对算力需求从MB级到PB级,计算类型也呈现计算精度多样化,为了支撑多元化计算场景落地,算力芯片呈现百花齐放态势,通用计算芯片、可定义计算芯片、AI计算芯片并存将是未来的主旋律。


 融合、标准、精准将助力算力设施多元化升级,通过硬件重构,构建计算、存储、IO资源池,通过软件定义方式,按照业务感知、按需组合方式可以快速、高效的面向图形识别、自然语言处理、大数据、关键计算等场景提供高效算力服务。面向多计算场景,通过标准化+微定制,可以快速满足多计算场景的硬件精准化设计,提供高效、多元、多态的算力设施供给。


多场景算力多样化部署云边协同高效协同


 随着5G、人工智能技术的发展,数字技术与实体经济相融合,云、边、端共存,云边协同将是未来数据中心的发展方向。面向自动驾驶、智慧城市、工业质检等智慧应用,业务决策也将从传统数据中心走向边缘侧、端侧。陈彦灵认为,未来将有20%的决策在端侧发生,有60%的决策在边缘侧发生。算力供给方式也将走出数据中心,部署到边缘侧,以提供高效、低时延的算力服务。同时,在边缘侧的算力设施也将面临形态多样化、部署场景复杂化、算力多元化的挑战。


 多年来,浪潮一直在边缘计算场景进行产品布局,并提供了完整的边缘服务器解决方案,包括边缘微中心、边缘服务器、便携AI服务器、边缘微服务器等多种方案,可以满足近场景端AI推理应用、车载算力、质检等AI场景和大数据搬迁的场景,以及面向近场的微型数据中心需求。


 陈彦灵表示,只有通过高效运维、快速交付、绿色节能、多元算力、云边协同的方式才可以推动数据中心集约、绿色、高效发展,同时开放计算也是实现数据中心高质量发展的必由之路。陈彦灵倡议产业上下游共同推动开放社区发展,通过建标准、建生态,联合产业上下游,围绕开放计算共同创新,将数据中心领先的技术普适化,推动我国数据中心产业的高质量发展,支持我国双碳目标在数据中心领域落地。