這次”料“更多 NVIDIA黃仁勛的GTC 2021”廚房“發布會再度上演
如果大家有印象的話,去年NVIDIA GTC大會,NVIDIA首席執行官黃仁勛在自家廚房進行大會演講應該是無出其右了。轉眼今年的GTC大會再次來臨,黃仁勛的”廚房“發布會再度上演。雖然場景沒有變,但是發布的內容確實”料“更多,涉及了AI、汽車、機器人、5G、實時圖形、協作和數據中心等。

黃仁勛說,NVIDIA會一如既往在CPU、DPU和GPU方面大力投入,并使其能夠用于研究人員和企業的全新數據中心級計算解決方案。硬件只是NVIDIA的一方面,作為一家軟件公司,NVIDIA提供一系列基于NVIDIA AI,以及用于仿真、協作和自主機器訓練的軟件。
組合拳——CPU、DPU和GPU
我們知道GPU是NVIDIA的”主業“,但是憑借一系列的收購,NVIDIA也在向其他XPU拓展,在本次大會上,NVIDIA推出了CPU、DPU和GPU的”組合拳“,幫助用戶打造完全可編程的單一AI計算單元。
CPU與GPU一直是好朋友,NVIDIA GPU作為加速計算組件,其實扮演了與CPU一起工作的角色。如今NVIDIA也推出了自己的首款數據中心CPU——Grace,Grace是一款高度專用型處理器,主要面向大型數據密集型HPC和AI應用。
Grace是高度專業化的處理器,工作負載面向例如訓練具有超過1萬億個參數的新一代NLP模型等。當與NVIDIA GPU緊密耦合時,搭載Grace CPU的系統速度比如今基于NVIDIA DGX 打造的最先進的系統(在x86 CPU上運行)快10倍。從這樣的成績可以看出,NVIDIA推出自有CPU芯片意在更好地實現與GPU的協同處理,讓性能表現更優秀。
Grace基于第四代 NVIDIA NVLink互聯技術,支持LPDDR5x內存子系統,并可以得到NVIDIA HPC軟件開發套件以及全套CUDA和CUDA-X庫的支持。據悉,瑞士國家超級計算中心將構建一臺名為Alps的超級計算機。這臺計算機將使用Grace和NVIDIA下一代GPU。美國能源部下屬的洛斯阿拉莫斯國家實驗室也將在2023年推出一臺基于Grace的超級計算機。
除了自研的CPU,憑借收購而來的Arm,也讓NVIDIA在CPU方面有了更多的話語權。在云計算、企業和邊緣數據中心、超級計算、PC等其他市場中,Arm也開始嶄露頭角。黃仁勛也宣布與多家重要的Arm合作伙伴展開合作,包括云計算領域的AWS、科學和云計算領域的Ampere Computing、超融合邊緣服務器領域的Marvel、以及將打造Chrome OS和Linux PC SDK與參考系統的聯發科。
DPU(Data Processing Unit,數據處理單元)是NVIDIA在收購Mellanox推出的創新產品,其可實現具有突破性的網絡、存儲和安全性能。作為業內首款400G以太網和NDR InfiniBand DPU,BlueField-3具有出色的網絡性能。相比上一代產品,它具有10倍加速計算能力、16個Arm A78 CPU核,和4倍的加密速度。BlueField-3也是首款支持第五代PCIe總線并提供數據中心時間同步加速的DPU。
此外,BlueField-3利用NVIDIA DOCA(集數據中心于芯片的架構)軟件開發包的優勢,為開發者提供一個完整、開放的軟件平臺,開發在BlueField DPU上開發軟件定義和硬件加速的網絡、存儲、安全和管理等應用。目前服務器制造商戴爾、浪潮、聯想和超微正在將BlueField DPU集成到他們的系統中,云服務供應商也在使用BlueField DPU來加速他們的業務,如百度、京東和UCloud。
黃仁勛還提到了NVIDIA的AI-on-5G計算平臺,該平臺充分利用 NVIDIA Aerial軟件開發套件與NVIDIA BlueField-2 A100——一種包含NVIDIA “5T for 5G”解決方案的、集成GPU和DPU的融合型卡,創建高性能5G RAN和AI應用。富士通、Google Cloud、Mavenir、Radisys和Wind River等合作伙伴都在開發適用于NVIDIA AI-on-5G平臺的解決方案。
不管是CPU還是DPU、GPU,很明顯,NVIDIA正在將自己業務邊界不斷延展,也就是不再局限于以GPU為中心,而是以計算為核心,覆蓋多樣化的計算工作負載。隨之而來的就是客戶選擇的靈活性,同時整個計算芯片市場也將迎來新的格局。
NVIDIA是軟件平臺公司
除了更富的硬件產品,NVIDIA在軟件方面的布局也業界有目共睹的,比如CUDA。所以,我們通常會在GTC大會上看到一系列的軟件更新。
在本屆大會上,NVIDIA發布了用于訓練Transformers的框架—— NVIDIA Megatron。Transformers在自然語言處理領域具有至關重要的位置,其在生成文檔摘要、將電子郵件中的短語補充完整、對測驗進行評分、生成體育賽事現場評論、甚至生成代碼等領域有著廣泛的應用。
此外,NVIDIA還發布了用于計算藥物研發加速庫Clara Discovery的一些新模型,以及與Schrodinger的合作;用于對話式AI的NVIDIA Jarvis已經可用,其能夠實現語音識別、語言理解、翻譯和表達性語音;加快推薦系統的NVIDIA Merlin現可通過NGC(NVIDIA的深度學習框架容器目錄)獲取。
為幫助客戶將自身專業知識應用于AI領域,黃仁勛發布了NVIDIA TAO,其可以運用客戶和合作伙伴的數據,對NVIDIA預訓練模型進行微調和適配,同時保護數據隱私。
量子計算也是當下的熱點,NVIDIA cuQuantum能夠為量子電路模擬器提供加速,以助力研究人員設計出更完善的量子計算機。
為了保障現代化數據中心的安全,黃仁勛發布了NVIDIA Morpheus數據中心安全平臺,其基于NVIDIA AI、NVIDIA BlueField、Net-Q網絡遙測軟件和EGX而構建,能夠對完整的數據包進行實時檢測。
開箱即用的產品
有了硬件又有了軟件,NVIDIA為用戶打造更加開箱即用的解決方案,其中包括專為工作組打造的“便攜式AI數據中心”——NVIDIA DGX Station,以及NVIDIA專為密集型AI研發打造的AI數據中心產品——NVIDIA DGX SuperPod。
全新DGX Station 320G借助320GB超快速HBM2e連接至4個NVIDIA A100 GPU,內存帶寬達到每秒8TB。然而,僅需將其插入普通的壁裝電源插座即可使用,耗電量只有1500瓦。此外,NVIDIA還發布了一種適用于NVIDIA DGX Station A100的訂閱服務。DGX Station A100是世界上唯一支持 NVIDIA多實例GPU技術的適用于辦公室場景的工作組服務器設備。
DGX SuperPOD是配備20套或以上NVIDIA DGX A100系統和NVIDIA InfiniBand HDR網絡的AI超級計算機。DGX SuperPOD使用全新80GB NVIDIA A100,將其HBM2e內存提升至90TB。目前它已經升級至采用NVIDIA BlueField-2,且NVIDIA如今還為該產品提供配套的NVIDIA Base Command DGX管理和編排工具。
為進一步實現AI民主化,黃仁勛發布了來自頂尖制造商的新系列NVIDIA認證系統,即大容量企業級服務器。它們現在已通過認證,可運行NVIDIA AI Enterprise軟件套件,該套件得到了全球應用最廣泛的計算虛擬化平臺——VMware vSphere 7的獨家認證。
NVIDIA于今日發布多款新系統,以擴大NVIDIA認證服務器生態系統。這些新系統配備用于主流AI和數據分析的NVIDIA A30 GPU,以及用于AI圖形、虛擬工作站以及混合計算和圖形工作負載的NVIDIA A10 GPU。
最后,NVIDIA推出推理服務器NVIDIA Triton,它可以從進入客戶EGX服務器或云實例的連續數據流中獲取洞察。這包括任何在cuDNN上運行的AI模型,也就是幾乎所有的AI ,包括來自TensorFlow、Pytorch、ONNX、OpenVINO、TensorRT等的任何框架。
其他——仿真協作與自動駕駛
在大會上,NVIDIA還公布了其他產品更新,比如NVIDIA Omniverse,其旨在創建共享虛擬3D世界,特點包括:可以擴展至多個GPU、具有高物理精度、能夠充分運用RTX實時路徑追蹤和DLSS、可以使用NVIDIA MDL模擬材料、可以使用NVIDIA PhysX模擬物理學并且與NVIDIA AI完全集成。
3D制作團隊通常規模龐大、應用技術繁多且所在地點分散,NVIDIA Omniverse Enterprise使其能夠在復雜的項目中開展無縫協作。設計師、藝術家和審核人員可以在任何地點、任何設備上進行線上實時協作,而不需要召開面對面會議或就大量文件進行交流和迭代。
Omniverse Enterprise是一個全新的平臺,它包含NVIDIA Omniverse Nucleus服務器(管理客戶端之間的共享數據庫)和NVIDIA Omniverse Connectors(業內領先的設計應用程序插件)。
它還包含兩個終端用戶應用:NVIDIA Omniverse Create,可加速場景構成,用戶可通過實時互動來裝配、點亮、模擬和渲染場景;NVIDIA Omniverse View,支持無縫設計協作,并能通過逼真的渲染技術實現建筑和工程項目的可視化。該平臺還包含NVIDIA RTX Virtual Workstation(vWS)軟件,它能讓協作者在任何地方自由地運行各類圖形密集型3D應用。
Omniverse Enterprise經測試和優化后,適合專業人員在NVIDIA RTX筆記本電腦及臺式電腦上運行,或在NVIDIA EGX平臺上的NVIDIA認證系統上運行。因此,從使用本地臺式電腦、筆記本電腦的小型工作組,到使用各種設備訪問數據中心的全球分布式團隊,任何規模的組織都可以部署該工具。
自動駕駛汽車領域是“機器學習和機器人技術所面對的最嚴峻的挑戰之一,NVIDIA構建模塊化的端到端解決方案,其自動駕駛汽車計算系統級芯片——NVIDIA DRIVE Orin將于2022年投產。與此同時,NVIDIA新一代車載系統級芯片NVIDIA DRIVE Atlan正式發布,其集NVIDIA在AI、汽車、機器人、安全和BlueField安全數據中心領域的所有技術之大成,為汽車帶來真正的數據中心。Atlan可以達到每秒超過1000萬億次(TOPS)運算次數,致力于應用到2025年的車型。
NVIDIA第八代Hyperion汽車平臺也同期發布,包括參考傳感器、自動駕駛汽車和中央計算機、3D地面真實數據記錄儀、網絡以及所有必要的軟件。在軟件方面,正如Omniverse能夠構建汽車生產工廠的數字孿生一樣,DRIVE Sim也可用于創建自動駕駛汽車的數字孿生,并將其用于自動駕駛汽車的開發。
總結劃重點
”廚房“發布會全程看下來,應該說看點頗多。但是總結一下,無外乎以下幾點:
如今是一家能夠提供GPU、CPU和DPU三種芯片的公司。
NVIDIA是一家軟件平臺公司。
NVIDIA是一家AI公司,提供Megatron、Jarvis、Merlin、Maxine、Isaac、Metropolis、Clara和DRIVE、以及各種可使用TAO進行定制化的預訓練模型。
NVIDIA正在通過用于研究的DGX、用于云的HGX、用于企業級和5G邊緣的EGX以及用于機器人技術的AGX來擴展AI。
總之,NVIDIA正在變得越來越”重“,基于已有產品,其業務領域不斷擴展。我們對于NVIDIA的定位和認知也正在刷新。
本文章選自《AI啟示錄》雜志,閱讀更多雜志內容,請掃描下方二維碼