最近總被客戶追著問H200的價(jià)格,說實(shí)話現(xiàn)在這個(gè)行情挺魔幻的。咱們拿現(xiàn)貨來說吧,整機(jī)含稅價(jià)普遍在230萬左右浮動(dòng)。要是走保稅倉(cāng)渠道的話,說不定能再砍下來個(gè)三五個(gè)點(diǎn),不過這得看具體采購(gòu)量了。
說實(shí)在的,現(xiàn)在這批Hopper架構(gòu)的卡確實(shí)搶手。光看那個(gè)HBM3顯存就知道,1024bit的超寬總線擺在那兒,搞大模型訓(xùn)練的企業(yè)都盯著呢。前兩天還有個(gè)做自動(dòng)駕駛的客戶跟我抱怨,說他們項(xiàng)目經(jīng)理催著要追加采購(gòu),生怕趕不上明年量產(chǎn)。

其實(shí)比起價(jià)格波動(dòng),更該關(guān)注的是交付周期。現(xiàn)在下單的話,正常渠道至少要等8-12周。著急用的客戶啊,建議考慮我們的保稅倉(cāng)現(xiàn)貨,雖然單價(jià)高點(diǎn),但是是能省下不少時(shí)間成本。您算算看,早一個(gè)月投產(chǎn)說不定就把差價(jià)賺回來了。
H200和H100到底差在哪
不少老客戶都在糾結(jié)選H100還是H200。單看報(bào)價(jià)的話,H200整機(jī)貴出10萬塊,但是是性能提升可不止這點(diǎn)錢吶。就拿Transformer模型訓(xùn)練來說,H200的吞吐量能比H100高出將近30%。要是算上省下來的電費(fèi),其實(shí)兩年就能回本。
不過也得看具體應(yīng)用場(chǎng)景。如果是做推理部署的,H100反而更劃算。畢竟A100級(jí)別的算力現(xiàn)在15萬就能拿下,性價(jià)比簡(jiǎn)直爆表。最近見到好些游戲公司都拿A100跑DLSS,效果居然不比專業(yè)卡差。
采購(gòu)門道可多了
真想省錢的話,建議關(guān)注季度末這個(gè)時(shí)間節(jié)點(diǎn)。根據(jù)往年海關(guān)數(shù)據(jù),Q2末價(jià)格通常會(huì)回調(diào)10-15%。我們手上現(xiàn)在就壓著幾單,專等六月底沖量的時(shí)候放出來。
對(duì)了,千萬別碰拆機(jī)件!上個(gè)月華東有個(gè)客戶圖便宜收了批號(hào)稱"庫(kù)存新機(jī)"的H800,結(jié)果SN碼全是套牌的。現(xiàn)在這行情啊,
認(rèn)準(zhǔn)四碼合一是底線,包裝盒上的防偽標(biāo)都得拿紫光燈照過才算數(shù)。
要說最穩(wěn)當(dāng)?shù)模€是走品牌直供通道。雖然價(jià)格死板點(diǎn),但是是售后服務(wù)真是沒話說。華碩那些大廠現(xiàn)在都提供30分鐘響應(yīng)服務(wù),遇到代碼43報(bào)錯(cuò)之類的毛病,一個(gè)電話工程師就帶著備件上門了。
最近5090不是要上市了嘛,據(jù)說不帶D的版本要到2.2萬。要是單純打游戲的話,等這個(gè)可能更劃算。但是是搞AI開發(fā)的客戶,還是得盯著
H系列和專業(yè)卡。畢竟cuda核心數(shù)量和內(nèi)存帶寬放在那兒,跑起訓(xùn)練任務(wù)來完全不是一個(gè)量級(jí)的。
囤貨策略要講究
現(xiàn)在稍微有點(diǎn)規(guī)模的客戶都開始玩庫(kù)存組合了。安全庫(kù)存留20%,流動(dòng)庫(kù)存?zhèn)鋫€(gè)50%,剩下30%走期貨。這樣既能應(yīng)對(duì)突發(fā)需求,又不會(huì)占用太多資金。聽說有家做數(shù)字孿生的公司,靠這套方法去年省了將近兩百萬的財(cái)務(wù)成本。
要是初次采購(gòu)拿不準(zhǔn)主意,我建議先拿A800試試水。性能跟A100差不多,價(jià)格也就15萬上下。
入門級(jí)AI訓(xùn)練完全夠用,等業(yè)務(wù)量上來再升級(jí)也不遲。前幾天剛幫個(gè)大學(xué)生創(chuàng)業(yè)團(tuán)隊(duì)配了八卡集群,用的就是這個(gè)方案,反饋說PyTorch跑得飛起。