本周在圣路易斯舉辦的SC25超級計算大會上,多家科技巨頭發布了面向AI熱潮的高性能計算產品。英偉達推出Apollo物理仿真AI模型和兩套基于Grace-Blackwell架構的RIKEN超級計算機。戴爾發布AMD Instinct驅動的XE9785服務器和英特爾R770AP服務器,以及兩款新交換機。法國與AMD合作建設首臺百億億次超級計算機Alice Recoque,預算6.4億美元,將成為歐洲第二臺百億億次系統。
CPU架構討論常聚焦于不同指令集的競爭,但實際上在單一系統中使用多種CPU架構已成常態。x86、Arm和RISC-V各有優劣,AI技術的興起更推動了對性能功耗比的極致需求。當前x86仍主導PC和服務器市場,Arm憑借龐大生態系統在移動和嵌入式領域領先,RISC-V作為開源架構展現巨大潛力。未來芯片設計將更多采用異構計算,多種架構協同工作成為趨勢。
AMD計劃在2026年推出Helios機架級架構,直接挑戰英偉達在AI基礎設施市場的地位。該系統將整合AMD的MI400系列GPU、第六代Epyc Venice CPU和Pensando網卡,設計為將整個機架的加速器作為單一大型GPU運行。CEO蘇姿豐表示,客戶對這一解決方案興趣濃厚,ZT Systems團隊在開發中發揮關鍵作用。AMD第三季度營收增長36%至92億美元。
谷歌宣布已將約3萬個生產軟件包移植到Arm架構,計劃全面轉換以便在自研Axion芯片和x86處理器上運行工作負載。YouTube、Gmail和BigQuery等服務已在x86和Axion Arm CPU上運行。谷歌開發了名為CogniPort的AI工具協助遷移,成功率約30%。公司聲稱Axion服務器相比x86實例具有65%的性價比優勢和60%的能效提升。
英偉達第三季度營收540億美元,超出分析師預期。盡管對華H20芯片銷售面臨限制,但公司在自動駕駛和機器人領域持續發力。其Drive AV平臺整合傳感器融合技術,Jetson AGX Thor機器人平臺性能大幅提升,Halos安全認證項目獲得權威機構支持,Cosmos世界模擬平臺為AI訓練提供超逼真環境。英偉達正從硬件供應商轉型為自動化解決方案提供商。
英偉達推出基于3nm工藝的GB10超級芯片,搭載于DGX Spark工作站中。該芯片采用聯發科設計的CPU和英偉達GPU通過NVLink互連,提供600GB/s雙向帶寬。配備128GB LPDDR5x內存,功耗僅140瓦,可支持700億參數模型微調和2000億參數模型推理。通過ConnectX-7網卡可實現多設備協作,為開發者提供從原型設計到生產部署的完整AI開發平臺。
低功耗芯片初創公司Efficient Computer發布旗艦產品Electron E1處理器,大幅降低通用計算工作負載的能耗需求。該芯片采用創新的"Fabric架構",實現空間數據流計算,與傳統馮·諾依曼架構相比,能效提升可達100倍。通過消除內存與處理核心間的頻繁數據傳輸開銷,特別適用于傳感器、可穿戴設備和無人機等邊緣計算場景。
人工智能芯片初創公司Hailo Technologies今日宣布推出第二代AI加速器Hailo-10H,具備強大的生成式AI功能。該芯片支持大語言模型、視覺語言模型等生成式架構,無需依賴云連接即可在設備上運行。Hailo-10H功耗僅2.5瓦,可應用于個人設備、智能家居、汽車和電信基礎設施等領域,實現首個令牌生成時間不到一秒,在2B參數模型上每秒處理超過10個令牌。
Intel在上汽國際車展推出第二代AI增強SDV SoC,憑借多節點chiplet架構提高計算、圖形與AI性能,降低成本,加速智能網聯車及ADAS的落地。
MediaTek 推出新一代 Kompanio Ultra 芯片,專為 Chromebook 設計。這款芯片不僅提升了性能和電池續航,更重要的是增強了生成式 AI 能力,使得價格親民的 ChromeOS 筆記本電腦也能運行先進的 AI 助手。MediaTek 與 Google 密切合作,確保新芯片能充分發揮 Chromebook Plus 設備的下一代 AI 功能。
Nvidia首席執行官黃仁勛在GTC大會上公布了未來三代GPU技術路線圖,揭示了計算能力提升面臨的巨大挑戰。從芯片制程到散熱和供電,Nvidia正通過增加硅片數量、提高封裝密度等方式來突破摩爾定律的限制。這些努力也反映出當前AI計算發展所面臨的瓶頸,以及未來數據中心設計的發展方向。