初創公司Positron獲得5160萬美元A輪融資,推出專門針對AI推理的Atlas芯片。該公司聲稱其芯片在性能功耗比和成本效益方面比英偉達H100高出2-5倍,并已獲得Cloudflare等企業客戶采用。Positron專注于內存優化設計,無需液體冷卻,可直接部署在現有數據中心。公司計劃2026年推出支持16萬億參數模型的下一代Titan平臺。
專家小組討論了AI加速發展的關鍵要素,包括硬件芯片設計、量子計算作用和技術擴展。Cerebras展示了餐盤大小的WSE超級芯片,被稱為"推理界的魚子醬"。專家們探討了從單原子量子比特到高精度計算的創新方法,預測量子計算將首先在研究領域產生影響。討論還涉及軟件開發、開源模型和摩爾定律的未來十年效率提升前景。
聯想集團推出專為人工智能工作負載優化的數據中心系統產品組合。主打產品ThinkSystem SR680a V4計算設備集成近二十個處理器,推理工作負載運行速度比上一代硬件快11倍。該系統配備8塊英偉達Blackwell B200顯卡、6個英特爾至強6處理器,以及8個英偉達SuperNIC和BlueField-3 DPU。同時發布基于SR675服務器的兩個系統和四個混合AI優勢產品包,涵蓋制造、酒店、安全和零售等應用場景。
人工智能能耗問題引發關注,量子計算或成解決方案。量子硬件在某些方面更適合AI底層數學運算,但目前錯誤率仍偏高。研究人員正著手準備,以便在硬件就緒時運行AI模型。本文探討了量子AI的潛力,包括量子電路在機器學習中的應用、將經典圖像數據輸入量子處理器的方法,以及在真實量子硬件上運行AI算法的初步嘗試。
亞馬遜云服務在獲取高質量服務器以構建 AI 基礎設施方面面臨挑戰。公司縮短了部分服務器和網絡設備的使用壽命,以騰出空間部署加速計算機。這些問題影響了亞馬遜近 1000 億美元的 AI 基礎設施投資計劃。盡管如此,亞馬遜仍看好 AI 前景,認為這是一個"一生難遇的商業機會"。