近期,業(yè)界傳出消息,中國(guó)眾多企業(yè)紛紛婉拒了NVIDIA的H20芯片,這一舉動(dòng)促使NVIDIA創(chuàng)始人黃仁勛親自前往臺(tái)積電進(jìn)行磋商。市場(chǎng)普遍猜測(cè),此行目的或是要求臺(tái)積電調(diào)整生產(chǎn)計(jì)劃,停產(chǎn)H20,轉(zhuǎn)而專注于制造一款針對(duì)中國(guó)市場(chǎng)定制的新型AI芯片,以期在與國(guó)內(nèi)AI芯片制造商的競(jìng)爭(zhēng)中占據(jù)優(yōu)勢(shì)。
據(jù)內(nèi)部消息透露,這款定制芯片被業(yè)界非正式命名為B30A,其基于NVIDIA的B300系列進(jìn)行深度定制。盡管預(yù)估其性能僅為B300的幾分之一,但即便如此,其性能依舊遠(yuǎn)超當(dāng)前市場(chǎng)上的國(guó)產(chǎn)AI芯片。這一消息無疑給正在奮力追趕全球AI技術(shù)前沿的國(guó)內(nèi)企業(yè)帶來了巨大的挑戰(zhàn)。
回顧NVIDIA的發(fā)展歷程,其高端芯片如H100和A100,以及后續(xù)的B200和B300,每一次升級(jí)都帶來了顯著的性能提升。例如,B300的推理性能是H100的30倍,而H100的性能又是A100的六倍。據(jù)此推算,即便B30A的性能僅為B300的十分之一,其性能也將是A100的18倍,這無疑將對(duì)國(guó)內(nèi)AI芯片市場(chǎng)產(chǎn)生深遠(yuǎn)影響。
對(duì)于國(guó)內(nèi)AI企業(yè)來說,選擇繼續(xù)使用NVIDIA的芯片,將能夠有效避免兼容性問題。由于全球大多數(shù)大模型都是基于NVIDIA的CUDA生態(tài)構(gòu)建的,因此繼續(xù)使用NVIDIA的芯片將有助于國(guó)內(nèi)企業(yè)更好地融入這一生態(tài),從而加速其技術(shù)進(jìn)步和市場(chǎng)拓展。
CUDA生態(tài)的強(qiáng)大之處,在于其歷經(jīng)十多年的發(fā)展,已經(jīng)形成了深厚的技術(shù)積累和廣泛的應(yīng)用基礎(chǔ)。當(dāng)年NVIDIA力排眾議,獨(dú)自推動(dòng)CUDA生態(tài)的發(fā)展,為全球程序員提供了極大的便利。如今,這一生態(tài)已經(jīng)成為NVIDIA在AI芯片市場(chǎng)中的核心競(jìng)爭(zhēng)力之一。AMD和Intel等競(jìng)爭(zhēng)對(duì)手在試圖進(jìn)入AI芯片市場(chǎng)時(shí),都曾因CUDA生態(tài)的壁壘而受阻。
采用NVIDIA的新款B30A芯片還將有助于降低國(guó)內(nèi)AI企業(yè)的能耗。隨著AI技術(shù)的快速發(fā)展,大模型的構(gòu)建和運(yùn)行所需的AI芯片數(shù)量急劇增加,能耗問題日益凸顯。而B30A芯片將采用臺(tái)積電4納米工藝生產(chǎn),這將大幅度降低其功耗,從而減輕企業(yè)的能耗負(fù)擔(dān)。