谷歌在AI基礎設施峰會上披露了其AI推理的驚人規模增長。從2024年4月的9.7萬億tokens/月激增至2025年8月的約1460萬億tokens/月,增長49.5倍。公司推出全新Ironwood TPU v7p系統,性能比前代提升5倍,內存容量增加6倍,單集群可容納9216個TPU。谷歌還展示了液冷技術和推理優化工具,可將推理延遲降低96%,吞吐量提升40%,成本降低30%。
NetApp本周推出StorageGRID對象存儲平臺第12版,新版本將改善AI工作負載擴展性,先進緩存技術可將訓練和HPC工作負載性能提升20倍。客戶可通過存儲桶分支對AI數據集進行版本控制,支持空間高效的對象存儲桶克隆。新版本還增強了加密標準、對象鎖定等安全功能。集成緩存簡化了AI工作流程中的緩存使用,性能比當前設備提升10倍。平臺發布限制翻倍,單個集群可支持超過6000億個對象。
數字內存計算芯片初創公司d-Matrix推出3D堆疊內存技術,聲稱相比當前行業標準HBM4,該技術可將AI模型運行速度提升10倍,能耗降低90%。該公司成立于2019年,采用LPDDR5內存配合數字內存計算硬件,通過改進的SRAM單元直接在內存陣列中執行計算。首款3DIMC芯片Pavehawk已在實驗室投入運行,下一代架構Raptor將整合該技術。
Bun團隊發布了1.2.21版本,新增MySQL和SQLite內置驅動、YAML解析器和密鑰管理器等功能。新的數據庫驅動屬于Bun.SQL API,現已支持MySQL、MariaDB和SQLite。據稱其MySQL客戶端比Node.js的mysql2包快9倍。Bun.secrets為CLI工具和本地開發提供原生密鑰管理。此版本還包含安全掃描API、獨立可執行文件構建API等更新。
戴爾閃電項目為PowerScale集群文件系統存儲帶來并行化性能提升,早期測試反饋積極。該項目旨在為PowerScale和ObjectScale存儲系統添加并行訪問能力,實現97%網絡利用率和支持數千個GPU。通過客戶端軟件層分布式讀取和RDMA技術,直接從客戶端訪問設備而無需遍歷文件系統,有望成為全球最快的并行文件系統,性能比競爭系統高出2倍。
英偉達發布Spectrum-XGS千兆級以太網交換平臺,實現數據中心間互聯協調,讓分布式GPU集群如同一個巨型處理器運行。同時推出Dynamo推理服務框架,通過分解式服務技術將上下文構建和令牌生成分配到不同GPU,顯著提升模型部署效率。在GPT和DeepSeek等模型測試中,令牌生成速度分別提升4倍和2.5倍,投機解碼技術更實現35%性能提升。
PCIe總線是連接x86服務器、PC和筆記本電腦核心處理器與外設的重要技術。隨著CPU和GPU性能提升,PCIe標準也在不斷演進,每一代帶寬都會翻倍。目前PCIe 4.0和5.0已廣泛應用,首批6.0外設開始推出。即將到來的PCIe 7.0將提供128GT/s傳輸速率,可能采用光互連技術,主要面向超大規模數據中心和高性能計算領域。PCIe 8.0的初步開發已啟動,預計傳輸速率將再次翻倍。
中國AI公司DeepSeek發布旗艦語言模型V3.1更新版,該模型已針對新一代國產芯片進行優化。新模型采用UE8M0數據類型訓練,為即將發布的國產芯片做準備。V3.1統一了"思考"和"非思考"模式,單一模型支持兩種范式,上下文窗口從65536擴展至131072個token,在工具調用能力上顯著提升,Browsecomp基準測試得分從8.9提升至30。
微軟發布.NET 10運行時和框架預覽版7,新增WebSocket連接流封裝、ASP.NET改進密鑰認證和MAUI多項功能修復。WebSocketStream提供基于流的抽象簡化編程,Blazor應用自動支持密鑰認證,MAUI新增XAML強類型源代碼生成器提升構建性能。作為LTS版本,正式版將于11月中旬發布。
近期用戶反映Firefox瀏覽器出現CPU和電力消耗激增問題,原因是Mozilla在最新版本中嵌入了LLM機器人用于標簽組命名。后臺運行的"推理引擎"進程造成了性能問題。Mozilla承認在功能推出過程中意外引入了性能漏洞,已暫停相關功能推廣。用戶可通過設置界面或about:config頁面禁用AI聊天機器人功能來解決此問題。
Nvidia在溫哥華Siggraph大會上發布了兩款小型Blackwell GPU:RTX Pro 4000 SFF和RTX Pro 2000,功耗僅70瓦。RTX 4000 SFF配備8960個CUDA核心,光線追蹤性能提升1.7倍,AI性能提升2.5倍,搭載24GB GDDR7顯存。RTX Pro 2000擁有4352個CUDA核心,3D建模性能提升1.6倍。兩款產品將由戴爾、惠普、聯想等廠商集成到OEM系統中。
Pure Storage發布研究報告,聲稱其直接閃存模塊(DFM)在功耗和碳排放指標上優于傳統SSD和機械硬盤。該公司表示,DFM具有更大容量且采用系統級管理,能以更少設備數量滿足容量和吞吐量需求,從而降低電力消耗。在10年使用周期的對比測試中,150TB DFM系統的年功耗比HDD系統低4.8倍,碳排放量也顯著更低。Pure Storage認為,系統級閃存存儲在速度、密度、可持續性和可靠性方面均超越HDD。
OpenAI發布了最先進的GPT-5語言模型,雖未實現通用人工智能但影響深遠。GPT-5采用統一系統架構,具備智能路由機制和自適應推理能力,在編程、數學推理等多項基準測試中創新高。該模型已免費向所有用戶開放并集成到微軟生態系統中。對教育領域而言,GPT-5提供個性化輔導功能,將深刻改變學習方式,教育機構必須積極適應這一變革。
Snowflake推出客戶端連接器,支持在其云數據倉庫中直接運行Apache Spark代碼,無需集群設置。該方案基于Spark Connect的客戶端-服務器架構,讓用戶可以使用Spark客戶端連接Snowflake分析引擎。據稱,預覽用戶的代碼運行性能平均提升5.6倍,成本降低約40%。此舉體現了數據湖和數據倉庫市場的融合趨勢。
Anthropic周一發布旗艦AI模型升級版Claude Opus 4.1,在SWE-bench Verified基準測試中獲得74.5%成績,超越OpenAI o3模型的69.1%和谷歌Gemini 2.5 Pro的67.2%。該公司年收入從10億美元增至50億美元,但近一半API收入依賴Cursor和GitHub Copilot兩大客戶。新模型采用最嚴格ASL-3安全協議,在多文件代碼重構方面表現突出,但面臨GPT-5競爭威脅。
MLPerf存儲基準測試第二版顯示,測試系統服務的加速器數量比2023年1.0版本增加約一倍。MLCommons表示本輪測試參與度大幅提高,提交機構地域代表性更強,系統多樣性更豐富。該基準測試評估存儲系統在Unet3D、Cosmoflow和Resnet50 AI訓練任務中的性能,以及Llama 3訓練中的檢查點性能。隨著AI訓練集群GPU數量增加,故障率上升,檢查點技術成為標準做法。
美光發布三款新一代SSD產品,均采用最新276層3D NAND技術。9650為PCIe Gen 6高速TLC驅動器,最高提供550萬IOPS隨機讀取性能;6600 ION是容量高達122.88TB的PCIe Gen 5 QLC存儲產品;7600則是專為低延遲設計的PCIe Gen 5 TLC驅動器。三款產品分別針對AI加速、大容量存儲和企業級應用場景,集成美光自研DRAM、控制器和固件技術。
Linux內核6.16在周末發布,雖然沒有重大新功能,但包含大量錯誤修復和代碼優化。該版本擁有3840萬行代碼,分布在超過78000個文件中。主要改進包括:支持英特爾2023年高級性能擴展,XFS和ext4文件系統性能優化,NUMA系統自動調優,五級頁表支持,以及USB硬件聲音解碼卸載功能。這些改進展現了Linux在大型服務器到小型設備的廣泛應用范圍。
軟件RAID供應商Xinnor宣稱其技術可在僅五小時多一點的時間內重建61.44TB SSD,速度約為傳統Linux RAID重建軟件的10倍。Xinnor的xiRAID產品將數據分布在驅動器集群中,每個驅動器上都有備用區域,故障驅動器的數據會恢復到這些區域,從而減少總體重建時間。測試顯示,在有主機工作負載的情況下,使用xiRAID重建速度比Linux mdraid快約30倍,且寫入放大因子低23%。
三星Galaxy S25系列搭載驍龍8 Elite處理器,AI處理速度提升40%,CPU性能增強37%,圖形渲染提升30%。配備40%更大蒸汽腔散熱系統,有效防止過熱。ProScaler AI圖像縮放引擎實時優化視覺效果,游戲模式可定制化設置避免干擾。Audio Eraser功能清理背景噪音,AI電池優化技術延長游戲時間,為移動游戲玩家提供專業級體驗。