英偉達CEO黃仁勛在GTC 2025大會上展示了AI推理吞吐量與響應時間之間的帕累托前沿曲線。數據顯示,從Hopper H200到Blackwell B200系統,通過硬件升級和軟件優化,性能提升達25倍。值得注意的是,在AI領域,硬件性能提升約2倍,而軟件優化可帶來額外5倍提升。英偉達在數周內通過軟件優化實現了過去需要兩年才能達到的5倍性能提升,證明軟件在AI性能提升中發揮著更關鍵的作用。
英偉達與新興云服務商CoreWeave簽署協議,承諾在2032年前為其提供63億美元GPU計算容量擔保。作為CoreWeave 7%股東,英偉達此舉旨在培養與AWS、微軟和谷歌抗衡的合作伙伴。該協議平均每年擔保9億美元容量,相當于約9400個GPU的年租賃。這種合作模式反映了AI領域中云服務商、芯片廠商和AI模型開發商之間復雜的資本循環關系。
英偉達宣布將RTX Pro 6000 Blackwell服務器版GPU引入標準企業服務器,使更多企業能夠使用Blackwell技術處理AI和傳統工作負載。思科、戴爾、惠普企業、聯想等廠商將在其2U企業服務器系統中提供該GPU。新系統采用x86架構、風冷設計,相比僅使用CPU的系統,性能提升45倍,能效提高18倍,可將數百臺CPU系統整合為少量RTX Pro服務器。
Voltron Data宣布其加速SQL引擎Theseus將支持AMD Instinct GPU,這標志著英偉達CUDA護城河正在變淺。Theseus使用GPU加速SQL查詢,能高速處理大量數據。隨著企業尋求利用AI,快速處理大量數據變得越來越重要。AMD投入大量資源構建開源軟件棧以縮小與英偉達的差距,最新版本基于AMD的hipDF庫。早期基準測試顯示AMD平臺性能表現良好,生產支持預計今年底推出。
在本周二的阿姆斯特丹的思科全球網絡會議(Cisco Live)上,企業網絡巨頭思科宣布與英偉達( Nvidia)合作推出一系列專為時下最受關注的熱門詞(AI/ML:人工智能/機器學習)量身定制的硬件和軟件平臺。