NEST036 August 2022
伺服器對於處理資料通訊至關緊要,因此伺服器產業與網際網路同步呈指數級成長。儘管伺服器單元最初是以 PC 架構為基礎,但伺服器系統必須能夠處理網路主機數量和複雜性不斷增加的問題。
圖 1 顯示了資料中心的典型機架式伺服器系統,以及伺服器系統原理圖。電源供應單元 (PSU) 是伺服器系統的核心,且需要複雜的系統架構。本文將探討五大伺服器 PSU 設計趨勢:功率預算、備援、效率、操作溫度以及通訊和控制。
在 21 世紀早期,機架式或刀鋒式伺服器 PSU 的功率預算範圍為 200W 至 300W。當時,每個中央處理器 (CPU) 的功耗範圍為 30W 至 50W。圖 2 顯示 CPU 功耗趨勢。
時至今日,伺服器 CPU 的功耗大約爲 200W (熱設計功率趨近 300W),將伺服器 PSU 的功率預算範圍大幅增加到至 800W 至 2,000W。為了支援日益增加的伺服器運算需求,例如網際網路上的雲端運算和人工智慧 (AI) 計算,伺服器可納入圖形處理單元 (GPU) 來與 CPU 共同運作。此作法可能會在五年內將伺服器的功率需求增加到 3,000W 以上。不過,由於大多數的機架式或刀鋒式伺服器 PSU 仍使用額定電流高達 16A 的交流插座,因此其功率預算有限:240V 交流輸入時約爲 3,600W,這中間考量到了轉換器效率。因此在近期內,3,600W 仍將是伺服器機架式 PSU 的功率限制值。
針對資料中心供電架,伺服器 PSU 設計人員廣泛採用國際電工委員會 (IEC) 60320 C20 交流插座,其額定電流爲 20A。PSU 功率預算受其交流插座電流額定值的限制,現今的資料中心 PSU 允許大約 3,000W;但在不久的將來,資料中心 PSU 的功率位準可能會增加到 5,000W 以上。爲了提高每個 PSU 的功率預算並實現更高的功率密度,您還可以使用交流插座匯流排來提高輸入電流額定值。
由於伺服器系統可靠性與可用性至關緊要,因此需要備援 PSU。若有一個或多個 PSU 發生故障,系統中的其他 PSU 可以接管供電。
簡易伺服器系統可具備 1+1 備援能力,這意味着系統中有一個主動 PSU 與一個備援 PSU。複雜伺服器系統可能具備 N+1 或 N+N (N>2) 備援能力,取決於系統可靠性與成本考量而定。爲了在需要更換 PSU 時維持系統正常運作,系統需要使用熱插拔 (ORing 控制) 技術。此外,由於多個 PSU 會在 N+1 或 N+N 系統中同時傳送電力,伺服器 PSU 也需要均流技術。
PSU 即使處於待機模式 (未從主電源軌向輸出供電),仍需要在熱插拔事件後立即提供全功率,因此需要不斷啟動功率級。爲了減少處於待機模式時的備援電源供應器功耗,「冷備援」正成為目前的發展趨勢。冷備援的用途是關閉主電源操作或在突發模式下運作,從而使備援 PSU 將待機功耗降至最低。
2000 年代初期的效率規格僅略高於 65%;當時的伺服器 PSU 設計人員未將效率列為優先考量。傳統的轉換器拓撲結構可輕鬆滿足 65% 效率目標。不過,由於伺服器必須持續運作,因此提高效率可大幅降低總體擁有成本。
自 2004 年以來,80 Plus 標準爲效率達到 80% 以上的 PC 和伺服器 PSU 系統提供了認證。目前量產中的伺服器 PSU 大多可達到 80 Plus Gold (>92% 效率) 要求,有些甚至可以達到 80 Plus Platinum (>94% 效率)。
目前開發中的伺服器 PSU 主要針對更高的 80 Plus Titanium 規格,該規格要求在半負載下需要超過 96% 的峰值效率。表 1 顯示各種 80 Plus 規格。
此外,根據資料中心 PSU 遵循的開放式運算專案 (OCP) 開放式機架規範,PSU 必須達到 97.5% 以上的峰值效率。因此,諸如免橋接功率因數校正 (PFC) 和軟切換轉換器等新拓撲結構,以及碳化矽 (SiC) 與氮化鎵 (GaN) 等寬能隙技術,可協助 PSU 實現 80 Plus Titanium 與開放式運算效率目標。
在伺服器 PSU 散熱管理方面,設計人員將風扇所在 PSU 交流插座處的環境溫度定義為伺服器 PSU 的操作溫度。2000 年代初期的操作溫度最高為 45°C,而今則攀升到最高 55°C,取決於伺服器機房中的冷卻系統而定。
較高的操作溫度可降低伺服器冷卻系統的能源成本。與資料中心的資本支出 (例如硬體設備) 相比,隨着時間推移,作爲營運支出的能源成本預計會高於資本支出。根據電源使用效率 (PUE) 標準:
PUE = 資料中心總功率/實際 IT 功率
如表 2 中所示,PUE 數字越小表示資料中心效率越高。圖 3 是在不同操作溫度下對 PUE 數字的估計值。例如,PUE 爲 1.25 的資料中心僅允許其冷卻系統佔用總功耗的 10%。這意味着需要提高伺服器 PSU 的操作溫度。
多年來,通訊與控制在伺服器電源方面發揮了重要作用。在 2000 年代初期,PSU 的內部資訊是透過系統管理匯流排介面傳送至系統端。在 2007 年,電源管理匯流排 (PMBus) 介面增加了一些功能,包括配置、控制、監控和故障管理、輸入/輸出電流和電源、電路板溫度、風扇轉速控制、即時更新程式碼、過壓 (電流、溫度) 和保護。此後,爲了回應日益增長的資料中心供電架需求,控制器區域網路 (CAN) 匯流排成爲了伺服器電源通訊的一部分。
電源管理控制器也隨著通訊匯流排一同演進。在 2000 年代初期,類比控制器主要負責控制伺服器 PSU。由於日益攀升的控制需求增加了對通訊的需求,使用數位控制器更容易實現這些需求。使用數位控制還可減少硬體工程師的偵錯工作量,從而在 PSU 設計和驗證階段降低人工成本。
隨著伺服器功率預算在體積保持固定的情況下成長,功率密度需求也將變得更為嚴格。新開發的伺服器 PSU 的功率密度已從 2000 年代初期的個位數增加到近 100W/in3。透過拓撲結構與元件技術的發展來改善轉換器效率,是實現高功率密度的解決方案。
與電流、功率和效率趨勢相同,理想的二極體/ORing 控制器必須以小型封裝提供高電流。理想的二極體/ORing 控制器還必須整合監控、故障處理和暫態處理等功能,以減少實現這些功能所需的整體元件數量和 PCB 面積。
舉例來說,伺服器 PSU 中的 PFC 電路從被動式 PFC 演進為主動橋接 PFC,然後再演進為主動式免橋接 PFC。隔離式 DC/DC 轉換器已從硬切換返馳和順向轉換器,演進為軟切換電感器-電感器-電容器諧振和相移式全橋轉換器。非隔離式 DC/DC 轉換器已從線性穩壓器和磁性放大器,演進為搭載同步整流器的降壓轉換器。整體效率的後續提升可降低內部功耗,並減輕解決散熱問題所需的心力。
運用在伺服器 PSU 的元件技術也在不斷進化,從 IGBT 和矽 MOSFET 演進為碳化矽 MOSFET 和氮化鎵 FET 等寬能隙裝置。IGBT 和矽 MOSFET 的非理想切換特性,將切換頻率限制在 200kHz 以下。寬能隙裝置的切換特性更接近理想的切換,使用寬能隙裝置可實現更高的切換頻率,以協助縮減 PSU 中使用的磁性元件數量。
隨着操作溫度的增加,伺服器 PSU 中的元件需要處理更高的熱應力,這也會推動電路的演進。例如,傳統的實作將機械繼電器與電阻器並聯,以抑制啟動期間的輸入突波電流。然而由於體積龐大、可靠性考量以及額定溫度等因素,因此在伺服器 PSU 中固態繼電器正逐漸取代機械繼電器。
3.6kW 單相圖騰柱免橋接 PFC 設計具有 >180W/in3 功率密度和 3kW 相移全橋式設計,主動鉗位 3kW 相移全橋式設計則具有 >270W/in3 的功率密度,旨在滿足伺服器中常見的備援電源供應器規格 (圖 4)。
在 3.6kW PFC 設計中,固態繼電器可容納高操作溫度。此處的 LMG3522R030 GaN FET 支援使用免橋接圖騰柱 PFC 拓撲結構。「小型升壓」可減少大型電容器體積,以獲得更高的功率密度。
在 3kW 相移全橋式設計中,LMG3522R030 GaN FET 有助於降低循環電流,且可實現軟切換。主動箝位電路可作為無耗損緩衝器,並能以較低的同步整流器電壓應力實現更高的轉換器效率。上述所有控制需求皆是透過作爲數位控制處理器的 C2000™ 微控制器來實現。