英偉達(dá)SCADA技術(shù)是一種新型存儲數(shù)據(jù)IO方案,GPU可直接啟動和控制存儲IO操作。與現(xiàn)有GPUDirect協(xié)議不同,SCADA不僅接管數(shù)據(jù)路徑,還控制IO控制路徑。該技術(shù)特別適用于AI推理工作負(fù)載中小于4KB的小塊數(shù)據(jù)傳輸,能顯著提升處理速度。英偉達(dá)正與Marvell、美光等存儲生態(tài)合作伙伴開發(fā)SCADA兼容的SSD和控制器產(chǎn)品。
Pure Storage發(fā)布Data Stream,這是一個以GPU為中心的AI數(shù)據(jù)管道集成硬件軟件堆棧。該解決方案運(yùn)行在FlashBlade//S和英偉達(dá)Blackwell GPU硬件上,可自動化加速企業(yè)AI管道的數(shù)據(jù)攝取、轉(zhuǎn)換和優(yōu)化。Data Stream具備自動化實(shí)時數(shù)據(jù)攝取、英偉達(dá)NeMo集成、GPU優(yōu)化管道加速等功能,支持多協(xié)議訪問,可處理數(shù)十億文件,通過在存儲層執(zhí)行并行轉(zhuǎn)換大幅降低推理延遲,為企業(yè)AI應(yīng)用提供即時訪問優(yōu)化數(shù)據(jù)的能力。
英偉達(dá)推出售價3000-4000美元的DGX Spark,號稱"全球最小AI超算"。該設(shè)備搭載128GB內(nèi)存,基于Blackwell架構(gòu)的GB10芯片,雖然速度不及RTX 5090,但能運(yùn)行消費(fèi)級顯卡無法處理的大模型。支持2000億參數(shù)模型推理和700億參數(shù)模型微調(diào),在AI開發(fā)領(lǐng)域具有獨(dú)特優(yōu)勢,但軟件生態(tài)仍需完善。
OpenSearch 3.0發(fā)布,性能提升9.5倍,新增GPU加速向量搜索、生成式AI等功能,并優(yōu)化數(shù)據(jù)傳輸和索引構(gòu)建,助力AI應(yīng)用發(fā)展。
VAST Data 開源其 VUA KVCache 軟件,通過在 NVMe SSD 上存儲 AI 模型推理過程中生成的令牌,避免重復(fù)計算,加快多步生成和對話續(xù)接。
Supermicro 執(zhí)行長暨總裁 Charles Liang 表示:“我們的全新 2U 2 節(jié)點(diǎn)多 GPU 服務(wù)器是適用于視頻直播、高階云端游戲和無數(shù)社交網(wǎng)絡(luò)應(yīng)用的理想平臺。