谷歌近日宣布,其第六代TPU Trillium已正式向Google Cloud的客戶開放。這一舉措旨在借助Trillium強大的計算能力、卓越的性能以及可持續性,進一步推動AI模型的發展。
作為Google Cloud AI超級計算機的核心組件,Trillium TPU代表了一種革命性的超級計算機架構。它融合了性能優化的硬件、開放的軟件環境、前沿的機器學習框架以及靈活的消費模型,共同構成了一個高度集成的系統。
早在今年5月的I/O開發者大會上,谷歌便已經宣布了Trillium TPU。據官方介紹,與上一代相比,Trillium TPU在訓練性能上實現了4倍以上的提升,推理吞吐量提升高達3倍,峰值計算性能更是提升了4.7倍。
在效率方面,Trillium TPU同樣表現出色。其能源效率提高了67%,每美元訓練性能提升高達2.5倍,推理性能也有1.4倍的提升。這一顯著的效率提升,無疑將為用戶帶來更加經濟實惠且高效的AI計算體驗。
在規模擴展方面,Trillium TPU同樣具備強大的能力。單個Jupiter網絡結構可容納多達10萬個Trillium芯片,同時配備了雙倍的HBM容量和ICI帶寬,支持大規模AI訓練。谷歌官方表示,Trillium的近乎線性擴展能力,配合高速芯片互連和Jupiter數據中心網絡,可以顯著加快大型模型的訓練速度。
舉例來說,在訓練gpt3-175b模型時,即使跨數據中心網絡運行,24個Pod(共6144個芯片)也能達到94%的擴展效率。這一成績充分展示了Trillium TPU在大型模型訓練方面的卓越表現。
Trillium TPU還具備出色的靈活性和可擴展性。用戶可以根據實際需求,靈活調整計算資源和配置,以滿足不同規模和復雜度的AI計算任務。這一特點使得Trillium TPU成為眾多企業和研究機構在AI領域的首選計算平臺。
隨著谷歌正式向Google Cloud客戶開放第六代TPU Trillium,我們有理由相信,這一先進的計算平臺將在未來為AI領域的發展注入更加強勁的動力。