导言
随着数据量的增长和云计算等需求的提升,服务器耗电量呈现日益上升的趋势,CPU的功耗也越来越高。Intel Purley服务器平台CPU的TDP(Thermal Design Power,热功耗)最 高为205W,到了最 新发布的Eagle Stream平台,单颗CPU的TDP增加至350W。随着功耗的增加,损耗也水涨船高,如何实现低能源损耗的主板设计就成为了一个重要的课题。
英特尔电源汇流排技术(Power Corridor Solution)就是为了应对这种挑战而提出的创新,该项专利技术可以大幅降低服务器主板在CPU供电部分的传输损耗,并满足电源性能要求,提高了服务器的能源转换效率。
将英特尔电源汇流排技术应用在大规模数据中心可以获得可观的电费节省,做到绿色低碳,节能减排。根据英特尔与烽火超微合作的产品测试结果,对于一个拥有 20 万台双路EGS平台服务器的数据中心,配置 TDP为350W的CPU,在电费成本0. 12 美元的条件下,五年内可以节省最 高 900 万美元的电费。
大电流带来的损耗挑战
CPU功耗的增加会给服务器主板带来硬件上的设计挑战。高功耗的CPU需要主板电源线路承载更大的电流。电能在传输中的功率损失(P)与电流(I)、电阻(R)相关,其关系为物理公式:
P=I2R
由公式可见,电流增加导致的损耗增加是平方关系,电流增加 1 倍,损耗增加 3 倍。这些功率损耗还会转化为废热,增加服务器的散热负荷。
主板设计能做的是尽量降低电源供电传输路径上的阻抗,以满足高功耗CPU的性能要求。这里的传输路径阻抗指的是从给CPU供电的主电源Vccin的电源转换控制器VR(Voltage Regulator)的输出,到CPU 插槽(Socket)端的电源传输路径阻抗Rpath,包含印刷电路板、封装和插槽部分。
缩短导体长度、增加导体截面积可以降低阻抗。主板设计中降低供电传输路径阻抗的传统解决方法是增加印刷电路板(PCB)叠层或铺更厚的铜,以增加电源层导体的总截面积。但这种方案会带来成本上的大幅上升,譬如PCB从 12 层变更为 14 层,会增加成本 20%左右。
英特尔电源汇流排技术并不增加PCB叠层,而是在主板背面增加额外的供电铜排来实现的,如下图所示:
该技术给原有主板设计带来的改动影响很小,只需要将一定厚度(0.8mm)的铜排,用表面贴装技术(SMT)组装到主板上即可。相应的,CPU的背板需要切割出相当于铜排大小的凹槽,以容纳凸起于主板表面的铜排。铜排与背板凹槽接触的一面覆盖绝缘漆,另一面与主板上的供电路径焊接在一起,即可实现电流导通能力的提升。
这个方案的技术难点主要有如下几点:
1. CPU背板的凹槽变动带来的CPU插座端的性能影响评估,如强度等;
2. 主板上PCB布线的改动;
3. 生产加工工艺技术对良率的影响,譬如汇流排焊接空泡率的控制等。
电源汇流排技术的实施需要生态链厂商的大力配合。英特尔联合供应链生态伙伴共同开展技术开发与验证,确保了新技术变更下的产品指标满足需求,如汇流条在焊接后的空泡率等达到设计目标等。
烽火超微积极导入新技术
英特尔与中国服务厂商烽火超微合作,将电源汇流排技术应用到了的后者基于英特尔Eagle Stream平台的项目中。烽火超微应用电源汇流排技术的主板CPU插座背面如下图(右侧)所示:
经过联合开发,烽火超微依据服务器量产的所有测试标准,全方位、系统性地评估了这个方案的可行性,测试结果显示这项技术是完全满足量产标准的。具体评测项目包括:
• CPU电源性能测试和仿真分析
• 传输路径阻抗Rpath和效率对比测试
• 系统散热测试
• CPU功耗测试对比
• SPECpower测试
• 热冲击测试
• 冲击和振动测试
• 渗透染红测试
• 空泡率测试(汇流排的焊接空泡率期望控制在5%以内)
• 电磁兼容EMC测试
• CPU背板和垫板可靠性评估
作为试点应用电源汇流排技术的参考方案,烽火超微Eagle Stream平台服务器配置如下:
系统:FitServer R2280 V7 机架式服务器
处理器:英特尔® 至强® Platinum 8458P 处理器(TDP 350W) ×2 路
内存:DDR5 4800 32GB × 16 条
硬盘:16TB HDD × 3
网卡:I350
RAID卡:LSI 9460-8i
测试结果显示,对于配置了350W TDP CPU的英特尔Eagle Stream平台两路服务器系统,使用英特尔电源汇流排技术可以在CPU 满载压力下的系统性能有如下直接提升:
• 约10W的整机功耗节省。
• CPU处理器供电传输路径阻抗在remote sense 点降低24%,在远端降低31%。
• 电源转换控制器VR效率额外提升0.7%。
• SPECpower在满载时的测试分数提高1%,优化了系统能效比。
• CPU插座底部附近温度最 高降低4℃。
开发团队也进行了电源仿真分析,结果和实测数据基本吻合。
对于CPU非满载下的工况,应用电源汇流排技术的样机也有不错的节能效果。如80% TDP负载时,整机能耗依然可以节省多达7W。在50% TDP负载下,整机能耗可节省3W。多种功耗下的测试数据表明,CPU功耗越高,电源汇流排技术带来的节能效果越可观。
电源汇流排技术除了直接提升了能效,还间接提升了系统稳定性和平台的升级潜力。譬如,从降低CPU插座底部温度看,一方面是由于阻抗减小使得损耗废热随之减少,另一方面,铜排本身也提供了导热和散热功能。这使得服务器主板以及元器件能将热量均衡快速的释放到外部,保证系统更加稳定运行。面向未来处理器的发展,原有主板可以额外支持更高功耗的CPU而不需要通过增加PCB电源叠层或者增厚铜箔。
巨细靡遗,涓流汇海
根据行业经验,数据中心约有70%运行成本来自电价。数据中心服务器数量众多,在庞大基数下,单台服务器数瓦的能效差异也会在长期运行中累积为巨大的数字。
假设一个数据中心,部署了 20 万台前述配置的Eagle Stream平台两路服务器,电价为0. 12 美元,在连续运营 5 年后,电源汇流排技术可以节省多少电费呢?
如果按满负荷下的能耗计算,如此规模的数据中心 5 年内节省电费最 高可达 931 万美元。
考虑到实际不同业务场下CPU利用率不同,数据中心需求也有峰谷差异,可以假设更多的场景。
• 当所有CPU均运行在80% 负载下,每台节约7W功耗,累计可以节省约 616 万美元。
• 如果只有80%的服务器满载,累计可以节省 721 万美元以上。
• 如果只有50%的服务器满载,累计可以节省 406 万美元以上。
• 即使是一个业务量非常不饱和的业务中心,所有CPU均只运行在50%负载下,也可以节省约 195 万美元的电费。
精诚合作,坚实落地
英特尔电源汇流排技术是一种可以降低服务器主板CPU供电传输损耗的创新型设计。在低碳节能的理念之下,烽火超微将这个创新方案积极导入到英特尔Eagle Stream服务器平台中。
在应用这项技术的过程中,英特尔本地技术支持团队与烽火超微团队紧密合作,进行了多次深度技术探讨,共同确定了方案,实现了以最小改动的方式优化印刷电路板的布板设计,确保了新技术和原有主板的良好兼容性设计。同时,英特尔美国团队也积极参与评估了这项技术改动对CPU端结构部分的设计风险,确保符合量产的质量需求。
由于生产工艺相对传统设计具有一定差异性,英特尔还联合供应链生态伙伴为客户提供全方位的技术支持。经过多次技术沟通和推动,连接器厂商安费诺Amphenol和立讯Luxshare均可以提供主板背面的铜排;嘉泽Lotes提供改动后的CPU背板;汉源Solderwell提供主板和铜排焊接接触时所需要的固体锡片。这些厂商的积极参与使得这项技术迅速落地。
严格考验,助力绿色节能
在系统验证阶段,烽火超微对应用英特尔电源汇流排技术的平台进行了从电源、散热、电磁兼容、生产等方面的多维测试。结果显示,通过电源汇流排技术,可以使得系统损耗降低约10W,CPU供电传输路径阻抗降低24%,总体效率在传统电源方案基础之上提升0.7%。而且,应用新技术的产品平台完全满足量产测试标准,可以进行规模化生产与推广。新的节能技术提升了烽火超微EGS平台服务器的竞争力,从节能降本、提升稳定性、扩展升级潜力方面为客户提供更多的价值。
面向数据中心的低能耗服务器设计是重要的开发方向,可以更好满足大规模数据中心的部署需要,符合国家双碳战略,促进产业链全生命周期的节能减排,助力行业绿色节能发展。
关于烽火超微
烽火超微致力于为客户提供“可端到端定制化、快速交付响应、可信赖的质量保障”三大价值,面向广阔的智能计算市场,烽火超微将进一步完善和拓展信息技术领域的产业布局,坚持“开源、开放、共享、共赢”的理念,和行业合作伙伴一起,共同打造一个完整的ICT生态环境,帮助客户在产品研发、企业运营、客户管理、供应链管理等环节加速数字化进程,促进企业数字化转型升级。
关于英特尔
英特尔(NASDAQ: INTC)作为行业引领者,创造改变世界的技术,推动全球进步并让生活丰富多彩。在摩尔定律的启迪下,我们不断致力于推进半导体设计与制造,帮助我们的客户应对最重大的挑战。通过将智能融入云、网络、边缘和各种计算设备,我们释放数据潜能,助力商业和社会变得更美好。