該文探討企業(yè)如何利用超級計算推動 AI 項目落地。HPE 高性能計算及 AI 基礎設施負責人表示,密集計算、擴展架構與液冷技術正助力大規(guī)模數(shù)據(jù)中心建設,亞太區(qū)增長迅猛,但高投入、能耗和人才短缺仍是嚴峻考驗。
文章闡述了數(shù)據(jù)中心由傳統(tǒng)向多樣化轉型,著重介紹了Intel Xeon 6 CPU采用P核與E核雙架構,在AI、高性能計算及云邊端場景中實現(xiàn)高效節(jié)能的創(chuàng)新應用。
本文比較了谷歌“鐵木” TPU Pod 與傳統(tǒng)HPC系統(tǒng)(如“El Capitan”和“Aurora”)在性能和成本上的表現(xiàn)。文章指出,盡管設計目標不同,但美國能源部通過優(yōu)惠合作,實現(xiàn)了更優(yōu)的性價比,而谷歌的比較存在誤導。
Rescale是一家數(shù)字工程平臺公司,剛獲得1.15億美元D輪融資,用于開發(fā)AI驅動的工程工具。該公司通過"AI物理學"技術將傳統(tǒng)需要數(shù)天的模擬計算縮短至秒級,已吸引包括貝佐斯、奧特曼等知名投資者支持。Rescale源于創(chuàng)始人在波音787研發(fā)中遇到的計算資源挑戰(zhàn),現(xiàn)已服務通用汽車等企業(yè)客戶。
隨著 AI 應用的加速發(fā)展,企業(yè)面臨著超越原始計算能力的瓶頸。AMD 提供智能高效的定制計算解決方案,從數(shù)據(jù)中心 AI 訓練到企業(yè)自動化,幫助組織無縫部署和擴展計算基礎設施。通過現(xiàn)代化數(shù)據(jù)中心、開源軟件棧 ROCm 以及全面的硬件產品組合,AMD 正在推動 AI 創(chuàng)新發(fā)展,為企業(yè)提供最佳性能和效率的解決方案。
AMD 發(fā)布第五代 Epyc 嵌入式處理器,采用 Zen 5 架構,專為網絡、存儲和工業(yè)邊緣計算優(yōu)化。新處理器在性能、能效和嵌入式特性方面均有提升,可支持高達 192 核心,內存容量達 6TB,并提供 7 年產品制造支持。多家行業(yè)合作伙伴已開始采用這一新產品。
VDURA是一家高性能計算和人工智能并行文件系統(tǒng)存儲供應商,最近在其V5000硬件架構平臺上增加了一個高容量全閃存存儲節(jié)點。V5000于三個月前推出,配備了中央瘦型(1RU)控制節(jié)點,控制混合閃存+磁盤存儲節(jié)點。新推出的全閃存F節(jié)點是一個1RU服務器機箱,最多可容納12個128 TB NVMe QLC SSD,提供1.536 PB的原始容量。VDURA的首席執(zhí)行官Ken Claffey表示,AI工作負載需要持續(xù)的高性能和可靠性,因此V5000不僅能達到最高速度,還能在硬件故障的情況下保持這些速度。
VDURA 將在即將舉行的能源高性能計算會議上展示其新一代數(shù)據(jù)平臺。該平臺旨在通過更快的數(shù)據(jù)處理、更高的數(shù)據(jù)持久性和更易用的混合環(huán)境,加速能源行業(yè)創(chuàng)新。VDURA 的混合架構結合了 HDD 和 SSD 的優(yōu)勢,為能源公司提供了優(yōu)化運營成本和工作負載速度的解決方案。
微軟推出 Copilot+ PC 標準,要求配備高性能 NPU,引發(fā) AI PC 市場格局變化。英偉達雖在數(shù)據(jù)中心 AI 領域占主導,但在 PC 端面臨挑戰(zhàn)。文章分析了英偉達的 AI PC 策略、NPU 與 GPU 的競爭關系,以及未來 GPU 可能在 Copilot+ 功能中發(fā)揮作用的前景。
DDN獲得3億美元投資,計劃將其在超級計算領域的領先優(yōu)勢轉化為AI存儲解決方案。該公司正在調整其高性能計算產品線以適應AI工作負載的需求,并承諾將于2月20日發(fā)布重大公告。這筆投資反映了AI基礎設施市場的快速增長和投資熱潮。
Panmnesia 開發(fā)的 GPU 內存擴展方案榮獲 CES 創(chuàng)新獎。該技術通過 CXL 技術將外部內存快速接入 GPU 統(tǒng)一虛擬內存空間,有效解決大規(guī)模 AI 訓練中 GPU 內存不足的問題,顯著降低 AI 基礎設施成本。該方案比傳統(tǒng)方法延遲更低,引起了 AI 數(shù)據(jù)中心行業(yè)的廣泛關注。
芯片制造商 AMD 投資 2000 萬美元入股 Absci 公司,進軍人工智能藥物研發(fā)領域,緊隨競爭對手 NVIDIA 的步伐。雙方達成協(xié)議,Absci 將使用 AMD 的芯片和軟件來支持其藥物研發(fā)工作,包括利用生成式 AI 的生物藥設計平臺。這一舉措凸顯了 AI 在藥物研發(fā)中的重要性,有望加快新藥開發(fā)進程,提高研發(fā)效率。
新加坡一所領先大學采用新諾公司的 xiRAID 存儲技術,顯著提升了其人工智能研究速度。該技術通過先進算法實現(xiàn)高性能、高可靠的數(shù)據(jù)存儲,支持包括醫(yī)療保健和自然語言處理在內的多個人工智能研究領域。這一部署不僅滿足了大學當前的存儲需求,還為未來的擴展提供了靈活性。
AIDC的基本架構可以劃分為多個層次和組成部分。在總體架構上,AIDC可以被劃分為基礎設施層、平臺管理層、大模型開發(fā)平臺層,以及行業(yè)應用層,如圖所示。
福特主要依靠本地系統(tǒng)運行建模及模擬類工作負載。當然,過往與亞馬遜云科技和Azure等超大規(guī)模云服務商的實驗合作,也證明了混合方案的出色靈活性。
啟用同步多線程(SMT)會對某些工作負載(尤其是高性能計算(HPC))產生中性到負面的性能影響。此外,一些應用程序許可證計算啟用的硬件線程數(shù)量而不是物理核心數(shù)量。因此,在你的 AMD EPYC 9005 系列處理器上禁用 SMT 可能是最佳選擇。
HPE表示,正在更新其高性能計算平臺產品組合。擴展的產品線包括了幾款新的HPE Cray Supercoming EX系統(tǒng),以及兩款新的HPE Proliant服務器,并且這些服務器針對AI工作負載進行了優(yōu)化,包括大型語言模型訓練和微調。
當HPC(高性能計算)遇上AI,科研效率直接起飛啦!想知道支撐HPC+AI深度融合背后的秘密武器?一起探秘“超智融合”的新思潮,解鎖HPC的未來形態(tài)!
NVIDIA DGX SuperPOD是下一代數(shù)據(jù)中心人工智能(AI)架構。旨在提供AI模型訓練、推理、高性能計算(HPC)和混合應用中的高級計算挑戰(zhàn)所需的計算性能水平,以提高預測性能和解決方案的時間。
根據(jù)中國信息通信研究院和分布式存儲產業(yè)方陣的市場調研及分析,2021年中國分布式存儲市場規(guī)模達到 178 億元,年增長率達到 44%,高于中國企業(yè)級外置存儲的 25%增長速度,預計未來 3 年中國分布式存儲市場規(guī)模仍將保持40%以上的年增長。