在人工智能飛速發(fā)展的當(dāng)下,智算中心(AIDC)作為算力的核心載體,其重要性不言而喻。它如同人工智能時代的算力“壓縮機(jī)”,對能源基礎(chǔ)設(shè)施系統(tǒng)的保護(hù)提出了遠(yuǎn)超傳統(tǒng)數(shù)據(jù)中心的嚴(yán)苛要求。有效的能源系統(tǒng)保護(hù),不僅關(guān)乎算力的穩(wěn)定持續(xù)輸出,更與數(shù)據(jù)安全以及環(huán)境可持續(xù)性緊密相連。為此,泰永長征精心打造了“智算中心能源基礎(chǔ)設(shè)施電源系統(tǒng)保護(hù)系列知識問答”,旨在幫助行業(yè)人士深入了解相關(guān)知識,本期我們先聚焦于智算中心電源系統(tǒng)保護(hù)的主要目的及系統(tǒng)穩(wěn)定的核心要素。
泰永長征給出了一個精煉的總結(jié):用移相變壓器穩(wěn)住電源,用STS保證不斷電,用SSCB防止事故擴(kuò)散。這一金句簡潔明了地概括了智算中心電源系統(tǒng)保護(hù)的關(guān)鍵要點。
我們先來了解“電源系統(tǒng)保護(hù)”的基礎(chǔ)概念。電源系統(tǒng)保護(hù)是對電源系統(tǒng)中出現(xiàn)的短路、過載、電壓異常等異常情況進(jìn)行檢測、判斷、隔離和恢復(fù)的技術(shù)體系。其核心目標(biāo)包含三個方面:安全,即防止事故擴(kuò)大;連續(xù),確保供電不中斷;穩(wěn)定,保證電能質(zhì)量可控。很多人容易將電源系統(tǒng)保護(hù)簡單理解為“跳閘”,實際上它涵蓋了預(yù)測、控制以及恢復(fù)等多個環(huán)節(jié)。
那么,智算中心為何對保護(hù)系統(tǒng)有著更高的要求呢?這主要源于其自身的特點。智算中心功率密度極高,單個機(jī)柜功率可達(dá)100kW以上;負(fù)載動態(tài)變化強,在AI訓(xùn)練過程中會出現(xiàn)瞬變情況;而且故障傳播速度極快,能在毫秒級擴(kuò)散。傳統(tǒng)的保護(hù)體系在毫秒級的響應(yīng)速度下,已經(jīng)難以應(yīng)對智算中心的這些特性。
“選擇性保護(hù)”在智算中心電源系統(tǒng)保護(hù)中至關(guān)重要。它指的是只切斷故障點,不影響其他區(qū)域的正常供電。例如,當(dāng)機(jī)柜出現(xiàn)短路時,只斷開該機(jī)柜的電源,而不是導(dǎo)致整排甚至整機(jī)房都掉電。從本質(zhì)上來說,故障隔離能力就代表著數(shù)據(jù)中心的等級能力。
“供電連續(xù)性”也是智算中心電源系統(tǒng)保護(hù)的關(guān)鍵指標(biāo)之一,即負(fù)載在電源出現(xiàn)異常情況時仍能保持不斷電。要實現(xiàn)這一目標(biāo),可以采用STS(毫秒級切換)以及儲能系統(tǒng)(瞬態(tài)支撐)等手段。
智算中心還面臨著諧波問題。由于GPU電源使用了大量開關(guān)電源,屬于非線性負(fù)載,會產(chǎn)生諧波。諧波會帶來發(fā)熱、損耗增加以及誤動作等影響。而移相變壓器可以有效解決智算中心的諧波問題。




















