從“夕發朝至”到“智算為王”:智算平臺成企業“大模型”時代成功關鍵
長期以來,人工智能與超級計算似乎是兩個獨立的領域。然而,隨著大模型訓練對算力需求的指數級增長,二者之間的界限逐漸模糊。并行科技董事長陳健一針見血地指出:“AI訓練的本質就是超算,超算也并不僅僅是CPU的超級計算機。超算架構、以GPU為核心的算力平臺成為大模型訓練的必備基礎設施。”
人工智能的浪潮洶涌而來,大模型如同一座座拔地而起的數字高峰,預示著一個全新時代的到來。然而企業構建這些高峰的基石,卻是一個常常被忽視的名字——智算平臺。如同GPT-4的誕生離不開強大的算力支撐,大模型的訓練和推理都需要一個高效、穩定的智算平臺作為基石。這其中既蘊藏著巨大的機遇,也充滿了挑戰與困惑。
長期以來,人工智能與超級計算似乎是兩個獨立的領域。然而,隨著大模型訓練對算力需求的指數級增長,二者之間的界限逐漸模糊。并行科技董事長陳健一針見血地指出:“AI訓練的本質就是超算,超算也并不僅僅是CPU的超級計算機。超算架構、以GPU為核心的算力平臺成為大模型訓練的必備基礎設施。”然而,傳統的云服務平臺在面對大模型訓練時卻顯得力不從心,其根源在于未能解決算力卡之間性能的問題,導致通信占比過高,無法滿足大模型對算力的極致追求。
并行科技董事長陳健
“夕發朝至”,智算推動的創新
賽力斯汽車平臺技術體系總監石蕩赫表示:“計算機輔助工程(CAE)的廣泛應用讓車企能在碰撞安全、強度耐久、震動、測試、生態、自動駕駛等方面實現全面創新,而這些需要足夠智算的支持。”
這從另一個角度揭示了企業在算力需求上出現了根本性的轉變。賽力斯為實現“夕發朝至”的目標——即工程師在下班前提交計算任務,第二天早上就能獲得計算結果,不僅需要滿足企業的全量業務需求,也要釋放原來可能不敢想象的潛在業務需求,還要滿足高效的開發要求。賽力斯與并行科技合作打造了基于混合彈性云架構的高性能計算平臺,這一平臺整合了集團內部算力資源,并結合自研的智能化仿真平臺,實現了云端資源的統一調度。
陳健客觀地總結道:“工程計算比科學計算復雜度高很多,對算力需求上用戶不光考慮能不能算出來,性能好不好,它更多考慮的是快速響應的能力,這將直接影響企業新產品的上市周期。”
從“超算”到“智能超算”,用戶關注極致性價比
面對大模型訓練帶來的算力挑戰,傳統的超算平臺顯然無法滿足需求。陳健提出了“智能超算”的概念,即面向人工智能的超算。他認為,超算用戶最關心的并非是能否完成計算,而是能否以最快的速度、以最低成本完成計算。
在大模型訓練的兩個主要場景——訓練(預訓練、微調)和推理中,不同的算力平臺展現出不同的優勢。H100憑借其強大的計算能力成為大規模訓練的首選,而4090則憑借其優異的訪存性能在中、大規模推理中占據優勢,但只有24G顯存卻只適合較小的模型推理,中、大規模的推理H20更適合。而昇騰系列則憑借其高性價比在大模型訓練領域嶄露頭角。
并行科技通過多年的超算經驗,總結出了一套獨特的應用運行特征分析方法:通過高精度、低負載采集數據,分析應用類型,并根據用戶應用預測不同算力平臺的性能表現,以此優化、適配算力資源,以實現最具性價比的大模型/算力匹配。例如,通過分析預測出H20與H100計算性能差了6倍,但在推理方面H20性能與H100相當,而實際測試結果也證實了這一預測的準確性。
智算平臺,未來已來
大模型的出現,將人工智能推向了一個新的高度,也對算力平臺提出了更高的要求。從“超算”到“智能超算”,不僅是技術上的升級,更是理念上的轉變。未來的智算平臺,需要具備更高的性能、更低的成本、更智能的調度能力,才能滿足大模型訓練和推理的苛刻需求。
陳健指出,未來智算平臺將成為大模型時代的核心基礎設施。如同電力和網絡一樣,智算平臺將成為支撐企業大模型應用和發展的基礎設施。“算力+算法”將成為大模型競爭的關鍵。企業僅有強大的算力還不夠,還需要與之匹配的算法和模型才能發揮出最大效能。擁有“算力+算法”雙重優勢的企業將在競爭中脫穎而出。智算平臺將推動人工智能應用的普及和發展。隨著智算平臺的不斷發展和完善,人工智能應用的門檻將進一步降低,更多的企業和個人將能夠享受到人工智能帶來的便利。
大模型時代已經到來,智算平臺作為其基石,必將在未來的發展中扮演更加重要的角色。算力企業與行業客戶在業務上的緊密融合,憑借各自豐富的經驗和前瞻性技術,將在這一波浪潮中乘風破浪,引領我國各行業向“新質生產力”方向健康發展。
本文章選自《AI啟示錄》雜志,閱讀更多雜志內容,請掃描下方二維碼
