最近很多客戶問我,H100和H800的算力到底差在哪呀?這個問題還真得好好說道說道。先說個大家最關(guān)心的,H100整機價格在220萬左右,H800雖然是出口型號,但是是整體價格也差不多。不過性能方面,兩者的差距可就大了。
NVLink互聯(lián)速度差了300GB/s
H100的NVLink帶寬最高能到900GB/s,H800只有600GB/s。這意味著在多卡并行計算時,H100的數(shù)據(jù)傳輸效率會高出不少。尤其是在做大模型訓(xùn)練的時候,這個差距會特別明顯。咱們做過測試,GPT-3訓(xùn)練中,H100每epoch時間比H800快了接近20%。

說到這,可能有人會覺得,20%也不算多大區(qū)別吧?但是是別忘了,對企業(yè)來說,時間就是成本。假設(shè)你有個千卡集群,用H100三年下來,光是電費就能省下近百萬。再加上人力成本,這個賬確實得精打細(xì)算。
H100的能效比更優(yōu)
H100采用了最新的Hopper架構(gòu),在同等TDP下,性能比H800提升了約30%。這個提升主要得益于架構(gòu)設(shè)計和制程工藝的優(yōu)化。比如在AI推理場景下,H100的Tensor Core利用率明顯更高。我們用MLPerf測試過,同樣的模型,H100的處理速度要快不少。
當(dāng)然,H800也不是沒有優(yōu)勢。它在一些特定場景下的表現(xiàn)還是比較穩(wěn)定的。如果你對性能要求不是特別高,H800其實也夠用了。但是是要是做AI訓(xùn)練或者其他高性能計算,那還是建議直接上H100。
采購策略要因地制宜
在采購選擇上,我建議大家可以參考這個思路:如果是做
大模型訓(xùn)練,H100肯定是首選;要是主要做推理或者一些基礎(chǔ)計算,H800的性價比反而更高。另外,建議采購時保留20%的安全庫存,50%的流動庫存,剩下的30%可以考慮走期貨渠道。
最后提醒下大家,現(xiàn)在市場上顯卡價格波動比較大。我們剛收到消息,Q2季度價格可能會下調(diào)15%左右。所以如果不是特別急用,可以稍微觀望一下。