亞馬遜云服務發布下一代定制芯片Graviton5,相比前代產品計算性能提升25%,同時保持高能效。新芯片配備五倍大容量L3緩存,網絡帶寬提升15%,存儲帶寬提升20%。基于Graviton5的M9g實例提供192核心密度,結合Nitro隔離引擎確保數學級安全保障。多家企業客戶測試顯示性能顯著提升。
Hammerspace通過現有NVMe存儲最大化GPU使用率。隨著AI計算在混合云和多云環境中擴展,基礎設施團隊面臨著加速洞察時間同時最大化GPU投資的壓力。Hammerspace Tier 0將GPU服務器集群內的本地NVMe存儲轉換為超高速共享存儲層,性能比傳統網絡存儲提升10倍,減少檢查點時間,提高GPU使用率,改善推理響應時間,無需額外存儲系統,節省數百萬美元成本。
Hammerspace在IO500基準測試中取得突破,其標準Linux加NFS系統軟件實現了HPC級性能,無需專有并行文件系統的復雜性。在SC25的10節點生產環境測試中排名第18位,這是NFS系統有史以來最快的結果。該公司使用標準Linux、上游NFSv4.2客戶端和商用NVMe閃存實現了總分85.23的成績,證明HPC級性能不再需要專有客戶端或特殊文件系統。
亞馬遜云服務AWS聲稱成為首家成功開發并部署自研密集波分復用DWDM轉發器技術的云服務商,可同時應用于城域網和長途網絡。新版DWDM轉發器相比前代產品帶寬提升73%,功耗降低35%,故障率減半。該技術支持400公里城域連接和數千公里長途連接,為客戶提供更快數據傳輸速度和更佳應用性能,同時保持成本不變。
Hammerspace發布v5.2數據平臺軟件,通過更快的元數據讀取、更好的數據放置和擴展性優化提升AI數據訪問性能。新版本IO500總分提升33.7%,總帶寬翻倍,IOR-Hard-Read測試提升超800%。增加了Tier 0親和性功能,支持GPU服務器本地存儲訪問,減少集群內網絡流量。新增Oracle云支持、Kerberos認證和標簽化NFS,提供更細粒度的訪問控制。該軟件將于12月正式發布。
AMD首席執行官蘇姿豐在紐約金融分析師日活動中表示,公司已準備好迎接AI浪潮并獲得傳統企業計算市場更多份額。AMD預計未來3-5年數據中心AI收入復合年增長率將超過80%,服務器CPU收入份額超過50%。公司2025年預期收入約340億美元,其中數據中心業務160億美元。MI400系列GPU采用2納米工藝,Helios機架系統將提供強勁算力支持。
Quantum為其ActiveScale磁帶后端推出范圍恢復功能,顯著提升部分對象檢索速度。客戶現在只需恢復大型對象中所需的特定字節范圍,而非重新激活整個文件,大幅縮短檢索時間。軟件更新還將小對象從冷存儲或磁帶層的讀取性能提升五倍以上。這些更新使基于磁帶的歸檔系統能夠作為響應迅速、可查詢的數據湖運行,專為AI、分析和高性能計算工作負載設計。
戴爾白皮書評估顯示,在PowerFlex系統上運行的Regatta數據庫能夠有效解決傳統數據庫在分片、復雜性、成本、性能和擴展性方面的固有限制。測試結果表明,事務處理達到近百萬IOPS,分析工作負載中五個計算密集型查詢展現線性可擴展性,流數據處理成功攝入十億行數據,單個Kafka客戶端的行插入速率超過每秒百萬行。
谷歌最新一代Ironwood TPU v7加速器即將上市,在性能上已接近英偉達Blackwell GPU水平。每顆TPU提供4.6 petaFLOPS的FP8性能,配備192GB HBM3e內存。谷歌真正優勢在于規模化能力,TPU pod最多可容納9216顆芯片,理論上可擴展至40萬顆加速器。采用3D環面拓撲和光學電路交換技術,在大規模計算集群方面具有獨特優勢。
AI搜索提供商Perplexity開發了新的軟件優化技術,讓萬億參數大模型能在老舊、便宜的硬件上高效運行,包括使用亞馬遜專有的彈性網絡適配器。這項創新解決了大規模專家混合模型面臨的內存和網絡延遲挑戰。研究顯示,相比單節點配置,優化后的核心程序在多節點部署中實現了顯著性能提升,使企業能更長時間利用現有硬件,或使用折扣云實例運行下一代前沿模型。
Python通過PEP 810提案正式引入惰性導入功能,允許程序延遲加載導入庫直到實際需要時才執行,而非在啟動時全部加載。該提案由指導委員會成員Pablo Salgado于10月3日提出并于11月3日獲批。新功能采用選擇性加入方式,保持向后兼容性的同時解決了社區長期面臨的啟動時間過長問題,標準化了當前分散的自定義解決方案。
WEKA的NeuralMesh高性能AI文件系統軟件將在英偉達即將推出的BlueField-4 DPU上運行,實現完全無需x86控制處理器的閃存JBOD架構。BlueField-4 DPU配備Grace CPU和ConnectX-9網絡,處理能力比BlueField-3提升6倍,支持800Gbps吞吐量。與傳統CPU附加存儲系統相比,該解決方案在智能AI工作流中可實現超過100倍的令牌/瓦特效率提升,為下一代AI工廠提供基礎存儲支持。
英偉達CEO黃仁勛在GTC 2025大會上展示了AI推理吞吐量與響應時間之間的帕累托前沿曲線。數據顯示,從Hopper H200到Blackwell B200系統,通過硬件升級和軟件優化,性能提升達25倍。值得注意的是,在AI領域,硬件性能提升約2倍,而軟件優化可帶來額外5倍提升。英偉達在數周內通過軟件優化實現了過去需要兩年才能達到的5倍性能提升,證明軟件在AI性能提升中發揮著更關鍵的作用。
Anthropic發布了Claude Haiku 4.5小型AI語言模型,性能接近五個月前的前沿模型Claude Sonnet 4,但成本降低三分之二,速度提升一倍以上。該模型在SWE-bench編程測試中得分73.3%,與Sonnet 4的72.7%相當。API定價為每百萬輸入令牌1美元,輸出令牌5美元,遠低于其他大型模型。新模型專為實時低延遲任務設計,可與Sonnet 4.5協同工作處理復雜編程任務。
DAOS是英特爾Optane時代的并行文件系統產品,現已被英特爾拋棄。Enakta Labs等DAOS基金會成員正在重新激活這一高性能系統。DAOS曾在2023年IO500測試中獲得1.3TBps帶寬的頂級成績。作為開源并行文件系統,DAOS需要與Storage Scale、Lustre等成熟產品競爭。Enakta Labs正在商業化DAOS,推出基于其的Enakta數據平臺產品,支持S3、SMB、NFS和PyTorch。該公司認為DAOS憑借卓越性能和開源特性,有望在新興云服務商中獲得采用。
在今年的開放計算項目峰會上,英偉達宣布Meta和Oracle將采用其Spectrum-X以太網平臺,這是專為AI工作負載打造的系統,可將數百萬GPU連接成統一架構。該平臺專門為大規模AI工作負載設計,聲稱網絡性能比傳統以太網提升1.6倍。Meta將其集成到開放交換系統中,Oracle則用它構建千兆級AI工廠,標志著網絡已成為AI時代的新操作系統。
大多數企業不會訓練自己的AI模型,而是專注于將AI應用到生產環境和推理階段。核心任務包括數據微調和管理。關鍵技術包括檢索增強生成、向量數據庫、AI提示重用和副駕駛功能,讓用戶能用自然語言查詢企業信息。由于GPU硬件更新速度快且成本高昂,企業更傾向于租用云端GPU容量。真正的AI價值在于推理階段快速整理數據并優化現有模型。
英特爾今日發布基于最新18A制造工藝的Panther Lake筆記本處理器系列,將在亞利桑那州新建的Fab 52工廠生產。該系列包含三款系統級芯片,最高配置擁有16核CPU和12核GPU。新處理器采用四芯片設計,集成神經處理單元,每秒可執行50萬億次運算。相比上代產品,CPU和GPU性能提升50%,能耗降低10%。英特爾還預覽了即將推出的Clearwater Forest服務器處理器系列,最高配置288個E核心。
高通在驍龍峰會上發布兩款旗艦處理器:驍龍8 Elite Gen 5手機芯片和驍龍X2 Elite PC芯片,旨在成為新一代智能體AI的硅基礎設施。新芯片采用3納米工藝,CPU性能提升20%,能效提升35%,GPU性能提升23%,NPU速度提升37%。重點是支持情境感知、多模態AI代理,能實時理解用戶需求并主動響應,實現設備間無縫協作。
bcachefs文件系統在被Torvalds逐出Linux內核后,發布了首個DKMS動態加載版本。目前內核6.17仍包含bcachefs代碼但未更新,項目負責人發布了可動態加載的新版本,暫時僅支持Ubuntu和Debian發行版。性能測試顯示DKMS版本表現更佳,多項測試中速度提升約一倍。openSUSE調整立場,計劃在6.18版本才移除支持。