中科馭數的芯片夢:讓每個服務器都有DPU
CPU一統江湖的局面正在慢慢被蠶食,這些蠶食者就是各種名為“XPU”的“小弟”,如GPU、DPU、IPU等等,其中GPU目前已經得到市場普遍認可,成長非常快,而DPU、IPU以及各種專用AI芯片還有待市場驗證。
在中科馭數創始人兼CEO鄢貴海看來,DPU很可能是繼GPU之后又一個有望引爆的芯片市場。中科馭數是一家2018年才剛剛成立的初創公司,選擇的正是DPU這條賽道。不久前,中科馭數發布了其下一代DPU芯片計劃,將基于自研的KPU(Kernel Processing Unit)芯片架構,圍繞網絡協議處理、數據庫和大數據處理加速、存儲運算、安全加密運算等核心功能,推出新一代DPU芯片。
風口上的DPU
今天DPU(Data Processing Unit)是業內的熱點話題,不過,鄢貴海告訴至頂網記者,中科馭數創業時其實并不清楚有DPU這類芯片的存在,只是因為看到了市場對DPU的需求,而自己有技術實力才進入這個市場。中科馭數的核心創業團隊來自中科院計算所計算機體系結構國家重點實驗室,十多年從事計算機體系結構的研究經歷使得他們非常了解產業的最新變化。
“做著做著,我們發現我們做得事情和國外一些公司做得一樣,這就是市場說的DPU。” 鄢貴海說。
鄢貴海解釋說,作為最新發展起來的一種專用處理器,DPU其產生的背景是數字智能時代,數據爆發導致的對計算延遲、數據安全、資源虛擬化的需求。
最初,數據中心的所有工作都由CPU來承擔,無論是數據的處理、數據的傳輸還是圖像的渲染。在數據量不太大的時候,CPU還能勝任,而隨著數據量爆炸性的增長,單純依靠CPU來打理一切變得不太可行,或者說不經濟。這才有了GPU、DPU等芯片的出現。
其實,在現代數據中心中,CPU的處理能力中很大一部分被用于執行基礎設施管理任務,例如掃描網絡流量中是否存在惡意軟件以及編排存儲設備,而DPU芯片如果接管其中一部分任務,就可以釋放CPU的計算能力去執行更高價值的任務,其潛在運營收益是巨大的。據估計,基礎設施管理任務將占數據中心CPU核心處理能力的20%至30%,這也正是DPU的價值所在。
簡單地說,CPU相當于一個通才,它長處是什么都能干,但效率不高,而GPU、DPU相當于專才,專門干一件或者一類事情,因此效率最高。今天,不少企業開始將CPU、GPU、DPU組合,來實現更經濟的效果。 在這個組合中CPU負責構建應用生態,GPU負責圖像處理核深度學習訓練,DPU負責卸載基礎層應用,比如網絡、安全、數據壓縮等。這就是我們今天說的異構計算。
談到CPU、GPU和DPU的區別,鄢貴海做了一個形象的比喻:如果把一臺計算機或服務器比作一個團隊,CPU相當于這個團隊的“大管家”,負責思考并處理各種業務;GPU是“美工”,專攻圖像處理;DPU則相當于“前臺”,負責打包、拆包“數據包”,提升整個團隊的工作效率。
異構核還是眾核?
在DPU的潛在市場,目前已經有了不少玩家,既有Intel、Broadcom、Marvall、Nvidia等巨頭,也有Fungible、Pensando等初創公司。這些公司中對DPU市場影響最大的可能是NVIDIA,正是NVIDIA讓DPU成為一個業內熱詞。去年,Nvidia發布了名為BlueField-2的DPU,今年應該會正式上市。不過,在行動上走得比較早的可能是Fungible,目前Fungible已經由兩款DPU芯片上市。
中科馭數與這幾家走的是不同的技術路線,這幾家選擇的是眾核,而中科馭數是異構核。通俗地說,就是Nvidia和Fungible的DPU的多個核是同構的,其中,Nvidia采用的是基于ARM的多核架構,Fungible采用的是基于MIPS的多核架構,而中科馭數DPU的多核是不同架構的,比如其中四個核心可能一個專門面向安全設計,一個面向網絡設計,一個面向數據庫設計,一個面向AI設計,架構各不相同。
這背后的一個重要技術原因是,中科馭數創新性提出了軟件定義加速器技術(Software Defined Accelerator),自主研發了KPU(Kernel Processing Unit)芯片架構。KPU架構凝聚了中科馭數創始團隊近十年在體系結構方面研究成果和研發經驗的積累。其相較于傳統的ASIC或SOC DPU芯片架構,具有極高的靈活性,可以通過即時的軟件配置來定義芯片內部數據運算邏輯,在保障充沛算力的同時,以最低功耗支撐更多運算負載類型。
鄢貴海表示,中科馭數的DPU以針對性算法加速為核心,通過KPU架構來組織異構核。在KPU架構下,中科馭數研發了國內首款芯片級完善的L2/L3/L4層全網絡協議處理核,推出了直接面向OLAP、OLTP及類SQL處理的數據查詢處理核,而沒有采用原來眾核為主的架構。

2019年成功流片的數據庫與時序數據處理融合加速芯片
“異構核架構將帶來更高效的數據處理效率、獲得更直接的使用接口,以及更佳的虛擬化支持。”鄢貴海介紹。
據悉,2019年中科馭數成功流片業內首顆數據庫與時序數據處理融合加速芯片。目前,芯片產品已經分別在金融領域的實時風控、大數據處理和異構數據庫加速等領域得到實際應用,并且得到非常用戶非常積極的反饋。今年將會推出第二代產品,功能層面包括完善的L2/ L3/L4層的網絡協議處理,可處理高達200G網絡帶寬數據。其次融合數據庫、大數據處理能力,直接面向OLAP、OLTP及大數據處理平臺,如Spark等。另外還囊括機器學習計算核以及安全加密運算核。接下來的2022、2023年也將分別新一代的產品推出,制程工藝也將分別從2019年的55納米,到今年的28納米,到明后年的12納米和7納米。
鄢貴海表示,DPU可能是一個比GPU更大的市場。“不一定每臺服務器都需要GPU,但很有可能每臺服務器都可能要一個DPU。”
機會很大,挑戰也不小,對于中科馭數而言,最大的挑戰還是要繼續打磨自己的產品,用更多的成功案例來教育客戶,贏得市場,讓客戶看到異構核DPU的價值。明知這條路上一定荊棘密布,但對技術的自信和對成功的渴望依然吸引鄢貴海帶領中科馭數一路向前。
本文章選自《AI啟示錄》雜志,閱讀更多雜志內容,請掃描下方二維碼