AMD與HPE宣布擴(kuò)大合作,共同開發(fā)下一代開放式可擴(kuò)展人工智能基礎(chǔ)設(shè)施。HPE將成為首批采用AMD Helios機(jī)架規(guī)模AI架構(gòu)的系統(tǒng)供應(yīng)商,該架構(gòu)整合了AMD EPYC處理器、Instinct GPU、Pensando網(wǎng)絡(luò)技術(shù)和ROCm開源軟件棧。Helios平臺每機(jī)架可提供2.9 exaFLOPS的FP4性能,采用開放機(jī)架寬設(shè)計(jì)標(biāo)準(zhǔn),旨在簡化大規(guī)模AI集群部署。HPE計(jì)劃2026年全球推出該解決方案。
聯(lián)想第二財(cái)季營收204.5億美元,同比增長14.6%。AI相關(guān)收入占總營收30%,達(dá)61.4億美元,較去年同期翻倍增長。然而基礎(chǔ)設(shè)施解決方案集團(tuán)(ISG)盡管收入增長23.7%至40.9億美元,仍虧損3200萬美元。云服務(wù)商業(yè)務(wù)雖增長21%但利潤微薄,企業(yè)市場表現(xiàn)更佳。十年來ISG累計(jì)銷售超840億美元卻總計(jì)虧損19.5億美元,反映出AI和HPC市場高需求但低盈利的困境。
并行文件系統(tǒng)在高性能計(jì)算中至關(guān)重要,為數(shù)千個(gè)計(jì)算節(jié)點(diǎn)提供高聚合I/O帶寬和低延遲訪問。系統(tǒng)分為分條型和非分條型:非分條型在單節(jié)點(diǎn)存儲文件,元數(shù)據(jù)負(fù)擔(dān)較輕;分條型將文件分片存儲到不同節(jié)點(diǎn),需維護(hù)分條映射信息。Dell Project Lightning項(xiàng)目通過專有客戶端驅(qū)動實(shí)現(xiàn)極致并行性能。
英偉達(dá)第三季度營收達(dá)570億美元,其中數(shù)據(jù)中心業(yè)務(wù)貢獻(xiàn)510億美元,同比增長66%。CEO黃仁勛表示,AI推理需求因預(yù)訓(xùn)練、后訓(xùn)練和推理能力的進(jìn)步而呈指數(shù)級增長。NVLink AI網(wǎng)絡(luò)基礎(chǔ)設(shè)施業(yè)務(wù)增長162%,營收82億美元。公司專注于功耗比優(yōu)化以降低數(shù)據(jù)中心運(yùn)營成本。盡管中國市場受地緣政治影響,但英偉達(dá)致力于在全球AI計(jì)算領(lǐng)域保持領(lǐng)導(dǎo)地位。
本周在圣路易斯舉辦的SC25超級計(jì)算大會上,多家科技巨頭發(fā)布了面向AI熱潮的高性能計(jì)算產(chǎn)品。英偉達(dá)推出Apollo物理仿真AI模型和兩套基于Grace-Blackwell架構(gòu)的RIKEN超級計(jì)算機(jī)。戴爾發(fā)布AMD Instinct驅(qū)動的XE9785服務(wù)器和英特爾R770AP服務(wù)器,以及兩款新交換機(jī)。法國與AMD合作建設(shè)首臺百億億次超級計(jì)算機(jī)Alice Recoque,預(yù)算6.4億美元,將成為歐洲第二臺百億億次系統(tǒng)。
分布式計(jì)算初創(chuàng)公司Taho完成350萬美元種子輪融資,目標(biāo)是替代Kubernetes成為人工智能工作負(fù)載的主要編排和調(diào)度層。該公司由來自Meta、谷歌和Snap的基礎(chǔ)設(shè)施資深人員創(chuàng)建,聲稱其計(jì)算框架可將工作負(fù)載處理時(shí)間提升最多100%,同時(shí)大幅降低成本。Taho開發(fā)了高性能聯(lián)邦計(jì)算框架,通過替換復(fù)雜的基礎(chǔ)設(shè)施軟件來提高AI硬件效率。
VDURA數(shù)據(jù)平臺第12版本通過擴(kuò)展元數(shù)據(jù)計(jì)算、添加系統(tǒng)級快照功能和支持疊瓦磁記錄硬盤來降低每TB成本。新版本引入彈性元數(shù)據(jù)引擎,可動態(tài)擴(kuò)展元數(shù)據(jù)節(jié)點(diǎn),將元數(shù)據(jù)操作性能提升最多20倍。快照功能支持即時(shí)的節(jié)省空間的數(shù)據(jù)集時(shí)點(diǎn)副本。SMR硬盤支持通過智能寫入放置引擎,在不影響吞吐量的情況下每機(jī)架增加25-30%容量。
美國能源部宣布與AMD、英偉達(dá)和甲骨文建立戰(zhàn)略合作關(guān)系,將在兩個(gè)國家實(shí)驗(yàn)室建造四臺強(qiáng)大的AI超級計(jì)算機(jī)。AMD與HPE合作為主權(quán)AI工廠超算項(xiàng)目提供技術(shù)支持,包括Lux和Discovery兩臺系統(tǒng)。英偉達(dá)與甲骨文合作打造能源部迄今最大的AI系統(tǒng)Solstice和Equinox,其中Solstice將配備10萬個(gè)英偉達(dá)Blackwell GPU。這些項(xiàng)目旨在鞏固美國在人工智能和高性能計(jì)算領(lǐng)域的領(lǐng)導(dǎo)地位。
HPE正在為橡樹嶺國家實(shí)驗(yàn)室構(gòu)建兩臺新超級計(jì)算機(jī):繼任Frontier的Discovery系統(tǒng)將采用HPE GX5000 Cray百億億次超算,專為AI與高性能計(jì)算融合時(shí)代設(shè)計(jì),配備K3000 DAOS存儲選項(xiàng)和Lux AI系統(tǒng)。Discovery將支持基于物理的建模、仿真、數(shù)據(jù)驅(qū)動AI模型和量子計(jì)算測試平臺功能。
以色列計(jì)算架構(gòu)公司NextSilicon推出Maverick-2加速器,采用智能計(jì)算架構(gòu)和數(shù)據(jù)流計(jì)算模式。該芯片聲稱性能比頂級GPU高10倍,功耗降低60%,可直接運(yùn)行未修改的C++、Python等代碼。芯片已在桑迪亞國家實(shí)驗(yàn)室的Spectra超級計(jì)算機(jī)中部署測試,在多項(xiàng)基準(zhǔn)測試中表現(xiàn)優(yōu)異。如果技術(shù)驗(yàn)證成功,將為HPC、AI和科學(xué)計(jì)算領(lǐng)域帶來重大突破。
英國研究與創(chuàng)新機(jī)構(gòu)發(fā)布初步市場參與通知,為下一代國家超級計(jì)算服務(wù)項(xiàng)目尋找供應(yīng)商。該項(xiàng)目預(yù)算高達(dá)7.5億英鎊,實(shí)際系統(tǒng)建設(shè)費(fèi)用約3-3.3億英鎊,將部署在愛丁堡大學(xué)。系統(tǒng)計(jì)劃2027年上線,使用下一代先進(jìn)芯片,服務(wù)傳統(tǒng)建模仿真和AI開發(fā)需求,預(yù)計(jì)性能可躋身全球前五。HPE、Atos等廠商有望成為主要競爭者。
阿斯頓馬丁阿美F1車隊(duì)已完成向NetApp存儲系統(tǒng)的全面遷移。NetApp系統(tǒng)支持AI驅(qū)動的設(shè)計(jì)、仿真和比賽策略,用于遙測分析、賽事策略優(yōu)化和賽車性能提升。該解決方案基于FlexPod融合基礎(chǔ)架構(gòu)和StorageGRID對象存儲,覆蓋英國工廠到各賽道的混合云環(huán)境,實(shí)現(xiàn)PB級數(shù)據(jù)的高效處理和傳輸。
新加坡國立大學(xué)的超級計(jì)算機(jī)"Hopper"成為該國首臺進(jìn)入全球Top500超級計(jì)算機(jī)榜單的設(shè)備,排名第105位。該系統(tǒng)每秒可執(zhí)行25千萬億次計(jì)算,大幅提升了研究效率。目前已應(yīng)用于清潔能源電池設(shè)計(jì)、人工智能視頻理解和生物醫(yī)學(xué)工程等領(lǐng)域,預(yù)計(jì)到2025年底將支持120個(gè)活躍研究項(xiàng)目。
是德科技高級副總裁兼通信解決方案事業(yè)部總裁Kailash Narayanan現(xiàn)場指出,算力固然重要,但如果能耗過高,技術(shù)的實(shí)用性將大打折扣,因此,所有的高速、高性能計(jì)算,都必須在極低的功耗下實(shí)現(xiàn),這是AI等技術(shù)能否大規(guī)模落地的核心前提。
Graid公司專注于英偉達(dá)GPU驅(qū)動的RAID卡技術(shù),推出包括企業(yè)級和工作站版本在內(nèi)的SupremeRAID產(chǎn)品線。該公司2024年?duì)I收翻倍,出貨約5000張卡片,預(yù)計(jì)2025年增長60%。產(chǎn)品路線圖涵蓋桌面簡化版、AI版本、HPC版本等五個(gè)組件,支持NVMe RAID并提供企業(yè)級數(shù)據(jù)保護(hù)。AI版本支持GPUDirect直接傳輸,HPC版本針對BeeGFS等環(huán)境優(yōu)化。
VAST Data將為Doudna超級計(jì)算機(jī)提供專注于AI的存儲系統(tǒng),與IBM Storage Scale共同承擔(dān)存儲任務(wù)。Doudna是NERSC-10超級計(jì)算機(jī),由勞倫斯伯克利國家實(shí)驗(yàn)室運(yùn)營,計(jì)算性能比前代系統(tǒng)提升10倍,存儲性能提升5倍。該系統(tǒng)采用雙存儲架構(gòu):VAST Data的AIOS負(fù)責(zé)AI工作負(fù)載,IBM Storage Scale處理傳統(tǒng)HPC需求。這標(biāo)志著VAST成功進(jìn)入HPC并行文件系統(tǒng)領(lǐng)域的重要突破。
VDURA公司完成重大轉(zhuǎn)型,將自己定位為與DDN、VAST Data和WEKA并列的AI和HPC高性能存儲解決方案提供商。該公司全面改造了原有PanFS軟件,推出基于微服務(wù)架構(gòu)的VDP數(shù)據(jù)平臺,結(jié)合并行文件系統(tǒng)的穩(wěn)定性能與對象存儲的彈性和成本效益。新平臺采用統(tǒng)一命名空間和單一控制平面,支持分層閃存-磁盤架構(gòu)。在美國聯(lián)邦項(xiàng)目競標(biāo)中,VDURA憑借優(yōu)異的性能和TCO擊敗競爭對手,證明了其在AI/HPC存儲基礎(chǔ)設(shè)施領(lǐng)域的競爭實(shí)力。
PCI特殊興趣小組(PCI-SIG)正式發(fā)布PCIe 7.0規(guī)范,帶寬再次翻倍達(dá)到128 GTps原始傳輸速率,在x16通道配置下可實(shí)現(xiàn)高達(dá)512 GBps雙向帶寬。相比2022年發(fā)布的PCIe 6.0的256 GBps,性能提升一倍。該技術(shù)主要面向800 Gbps以太網(wǎng)適配器、高性能計(jì)算和機(jī)器學(xué)習(xí)等高吞吐量應(yīng)用。同時(shí),PCI-SIG首次推出基于光纖鏈路的PCIe標(biāo)準(zhǔn),并已開始PCIe 8.0規(guī)范的前期研發(fā)工作。
Sandia國家實(shí)驗(yàn)室與SpiNNcloud合作推出的SpiNNaker2類腦超級計(jì)算機(jī),依靠48芯片高并行架構(gòu)及高速SRAM/DRAM通信,無需GPU或內(nèi)置存儲,適用于國防及前沿計(jì)算任務(wù)。
Atos 正在重組,法國政府已確認(rèn)以4.1億歐元收購其 Eviden 子公司先進(jìn)計(jì)算業(yè)務(wù)(不含 Vision AI 部分),該業(yè)務(wù)涵蓋 HPC、量子計(jì)算及 AI 部門,預(yù)計(jì)2025年?duì)I收約8億歐元,此舉將為 Atos 提供急需流動資金。