高帶寬閃存技術承諾提供超大容量,但面臨極其復雜的工程挑戰。該技術將多層NAND芯片堆疊,每層由數百個3D NAND單元層組成,可創造前所未有的存儲容量。相比昂貴的HBM內存,HBF使用更便宜但速度較慢的閃存為GPU提供更多存儲空間。技術復雜性體現在互連布線的困難,12層HBF堆疊將包含2866個存儲層。由于需要英偉達等GPU廠商深度參與和行業標準制定,預計HBF距離商用還需兩年以上時間。
微軟宣布其首個人工智能"超級工廠"在亞特蘭大正式投入運營,這是一座耗資數十億美元的數據中心設施。該設施將與全國其他數據中心基礎設施相連,為客戶提供強大的計算能力。新設施占地85英畝,面積超過100萬平方英尺,配備數十萬個英偉達最強大的GPU和AI加速器。作為微軟Fairwater網絡的一部分,該設施專門用于訓練和運行AI模型,將為OpenAI、Mistral AI和xAI等公司提供服務。
太空數據中心能夠解決地面數據中心的根本局限性。在軌道上,太陽能充足且持續,無夜晚、云層或季節變化影響。太空數據中心可減少衛星客戶端延遲,為太空系統提供實時計算能力,并推動人類太空擴張所需技術發展。主要挑戰包括散熱、規模化部署、太空碎片風險和維護難題,但隨著成本下降和技術進步,太空數據中心將成為必然趨勢。
人工智能初創公司Counterintuitive Corp.正式發布,旨在通過開發專為推理而非模仿設計的芯片和軟件來重新定義AI。該公司提出人工推理單元(ARU)這一全新計算架構類別,以解決現代AI面臨的"精度無真理、推理無記憶"雙重困境。ARU采用確定性、記憶驅動的推理架構,配合全棧推理軟件,承諾突破當前AI局限性,開啟后GPU時代的智能計算新紀元。
哈佛大學伯克曼·克萊因中心探討人類智能是否實際上就是一種計算智能形式。谷歌技術與社會首席技術官在秋季演講系列中力挺"大腦即計算機"觀點,認為大腦不僅像計算機,本身就是計算機。該理論將大腦比作預測性處理器,類似大語言模型通過預測下一個詞元工作。支持者認為通過擴大計算規模可實現AGI,但也有聲音質疑當前架構可能遇到瓶頸。研究者希望通過破解AI內部機制來理解人類思維。
圖數據庫廠商Neo4j推出Infinigraph架構,支持在單一圖數據庫平臺上運行操作和分析工作負載,處理超過100TB規模數據而不分割圖結構。該產品采用分片技術,支持數十億關系和數千并發查詢,同時保持ACID特性。新架構可將數千萬文檔作為向量直接嵌入圖中,應用于欺詐檢測、知識圖譜等場景。
人工智能芯片初創公司SiMa Technologies宣布其第二代系統級芯片平臺MLSoC Modalix正式出貨,專為多模態物理AI工作負載設計。該芯片可嵌入機器人、工業設備和車輛等設備中,支持運行大語言模型、卷積神經網絡等多種AI算法。芯片采用低功耗設計,能在邊緣設備上直接處理傳感器數據并運行AI模型,無需依賴云端處理,有效降低延遲。
新加坡AI初創公司Sapient Intelligence開發出層次推理模型(HRM),在復雜推理任務上匹配甚至超越大語言模型性能,同時顯著降低數據和內存需求。該架構模仿人腦雙系統運作機制,通過高層抽象規劃模塊和低層快速計算模塊協同工作,避免了鏈式思維推理的局限性。在極難數獨和迷宮問題上,HRM僅用1000個訓練樣本就達到近完美準確率,而先進語言模型完全失敗。
Perplexity本周發布的Comet AI瀏覽器標志著智能代理應用時代的到來。該瀏覽器采用AI原生設計,配備能夠理解網頁內容的AI助手,可在側邊欄中實時回答用戶問題。OpenAI隨即宣布將推出自己的AI瀏覽器,驗證了這一趨勢。智能代理應用不同于傳統的AI功能增強產品,而是圍繞AI能力重新構建整個工作流程。企業需要從SEO轉向AEO優化,為AI發現做好準備。
檢索增強生成(RAG)正成為AI領域的關鍵技術,通過結合外部信息檢索與大語言模型的生成能力,解決傳統模型僅依賴訓練數據的局限性。RAG允許模型實時訪問外部數據庫或文檔,提供更準確、更新的信息。該技術可應用于企業文檔查詢、個人化AI助手等場景,通過向模型提供特定領域知識來獲得精準結果。微軟專家指出,RAG有助于結合知識與推理、提高模型使用效率,并支持多模態應用。
來自上海交通大學和浙江大學等機構的研究團隊開發出首個AI"記憶操作系統"MemOS,解決了AI系統無法實現人類般持久記憶和學習的根本限制。該系統將記憶視為核心計算資源進行調度、共享和演化,在時間推理任務中相比OpenAI記憶系統性能提升159%。MemOS采用三層架構設計,通過標準化記憶單元實現跨平臺記憶遷移,有望改變企業AI部署模式。
存儲行業近期動態頻繁,Arctera、Wasabi和TD SYNNEX聯合推出渠道專屬數據保護解決方案;AWS啟用EC2環境SAN啟動功能;Broadcom發布VMware Cloud Foundation 9.0版本;Commvault與Kyndryl合作提升網絡彈性服務;CTERA成為首家支持模型上下文協議的混合云存儲供應商;多家企業獲得新一輪融資,推動AI基礎設施和數據管理技術發展。
文章闡述了數據中心由傳統向多樣化轉型,著重介紹了Intel Xeon 6 CPU采用P核與E核雙架構,在AI、高性能計算及云邊端場景中實現高效節能的創新應用。
本文介紹了 Sakana 針對語言模型提出的全新 CTM 架構,通過內部短時記憶和自適應運算,令模型推理更接近人類思考方式。
Salesforce正通過構建完整的AI全棧體系,將SaaS升級為服務即軟件,全面整合智能、記錄與交互系統,實現企業生產效率大幅提升。
Nvidia 推出基于 BlueField 處理單元的 DOCA Argus 框架,實現對 AI 工作負載的無代理實時威脅檢測,并與 Cisco 合作,為 AI 基礎設施提供全方位安全防護。
Ocient成功融資4210萬美元,加速研發基于NVMe SSD與計算近接存儲架構的綠色、低成本大數據與 AI 分析解決方案。