加州大學伯克利分校研究團隊利用OpenEvolve開源工具,成功將專家并行負載均衡算法性能提升5倍。該算法用于大型語言模型中將令牌路由到專門的專家模塊。研究人員通過AI驅動的系統研究方法,讓AI模型迭代生成、評估和優化解決方案,僅花費不到10美元和5小時就實現了顯著性能提升。研究表明AI在算法設計中的巨大潛力,未來有望廣泛應用于系統性能優化領域。
AI平臺公司Clarifai發布新推理引擎,聲稱能讓AI模型運行速度提升一倍,成本降低40%。該系統采用多種優化技術,從CUDA內核到高級推測解碼,能在相同硬件上獲得更強推理性能。第三方測試顯示其在吞吐量和延遲方面創下行業最佳記錄。該產品專門針對推理過程優化,特別適用于需要多步驟響應的智能體和推理模型。
AMD推出ROCm 7.0軟件平臺,在推理性能上實現3.5倍提升,訓練浮點性能提升3倍。該平臺支持OCP微縮放數據類型硬件加速,引入AI張量引擎AITER,可將MLA解碼操作提升17倍。結合MI355X芯片,AMD聲稱在DeepSeek R1推理負載中性能超越英偉達B200芯片1.3倍,并已集成至vLLM和SGLang等主流推理引擎中。
LibreOffice 25.8版本以"更智能、更快速、更可靠"為特色正式發布。新版本在多個方面實現性能優化,包括啟動速度、文檔滾動和文件打開速度的顯著提升。該版本增強了對微軟Office文檔格式的兼容性,改進了連字符處理和字體兼容性,Calc表格組件新增十多個函數以更好支持Excel文件導入。值得注意的是,LibreOffice 25.8首次支持PDF 2.0格式導出,并具備PDF數字加密和簽名功能。新版本提高了系統要求,不再支持Windows 7/8系列和32位系統。
Google 發布全新的 Gemini 2.5 Pro 實驗版模型,號稱是其"最智能"的 AI 模型。該模型具備 100 萬 token 的上下文窗口、多模態處理能力和推理能力,在多項基準測試中表現優異。測試結果表明,這是目前最令人印象深刻的生成式 AI 模型之一。
Linux 內核 6.13 版本正式發布,帶來了多項改進。主要包括 AMD CPU 和 GPU 的電源管理優化、對新硬件的支持、文件系統的改進以及新的內核調度模型。雖然這些變化對普通用戶影響有限,但為未來的重大改進奠定了基礎。
Meta發布開源大模型Llama-3,具有80億和700億參數版本,性能在推理、數學、代碼生成等方面有顯著提升。Llama-3采用了分組查詢注意力、掩碼等技術,提高了計算效率。預訓練數據達15T tokens,支持多語言。測試顯示Llama-3性能超過多個知名模型。