最近很多客戶都在問,英偉達A100的功率到底有多大呀?這個問題確實挺關(guān)鍵,尤其是做企業(yè)級部署的時候,電費可是一筆不小的開銷。今天我們就來聊聊A100的功耗問題,順便給大家一些采購建議。
A100的TDP與真實功耗
官方給出的A100 TDP是400W,但是是這只是理論值。實際使用中,功耗會受到很多因素影響,比如負載情況、散熱條件,還有你是不是超頻了呀。根據(jù)我們的實測數(shù)據(jù),A100在滿載運行時,功耗一般在380W到420W之間波動。

不過吶,如果是在AI訓(xùn)練這種高強度場景下,GPU會頻繁調(diào)用Tensor Core,功耗可能還會再往上跑一點。所以我們建議,在做電源規(guī)劃的時候,最好給每張A100預(yù)留450W的余量,這樣比較穩(wěn)妥。
集群部署的功耗管理
對于企業(yè)用戶來說,A100通常都是成批購買的。一個8卡的服務(wù)器,光GPU的功耗就接近3.6kW。再加上CPU、內(nèi)存、硬盤等其他部件,整機功耗輕輕松松就能上到5kW。
這么高的功率,散熱和供電都要提前規(guī)劃好。我們有些客戶之前沒注意到這個問題,結(jié)果機房電力不足,只好臨時擴容,多花了不少冤枉錢。
能耗成本怎么算
給大家舉個例子吧。假設(shè)一個數(shù)據(jù)中心有100張A100,按照每天運行24小時,電費0.8元/度來計算,一年的電費大概要250萬左右。這還沒算空調(diào)散熱的費用呢。
所以吶,在采購A100的時候,除了關(guān)注性能,能耗這塊也要好好算一算。特別是那些預(yù)算有限的企業(yè),選對顯卡型號真的很重要。
采購建議
如果對算力要求沒那么高,其實可以考慮A800。它的性能跟A100差不多,功耗卻低了不少,性價比更高一些。當然啦,具體選哪個,還是要看你們的實際需求。
最后提醒一下,買A100的時候一定要找正規(guī)渠道?,F(xiàn)在市面上假貨不少,尤其是二手市場,很多顯卡都是礦卡,用不了幾天就可能出問題。