開源硬件從超大規模數據中心向傳統企業擴展
自2011年Facebook成立OCP以來,包括惠普、戴爾、微軟在內的近200家企業成為了OCP(Open Compute Project)的成員,該組織已經發布了數十款服務器、交換機以及其他系統和主板的開源設計。
目前,4家規模最大的超大互聯網公司提供商中已有3家(Google、Facebook和Microsoft)加入OCP 。此外,OCP也正逐漸滲透到傳統企業中,他們不僅積極探索OCP,而且已經實施了一些重要的OCP部署并致力于實現這些部署的持續發展。
今年有超過3500名工程師注冊參加了OCP大會,其中有約178受訪者稱,他們每年在數據中心設備上的花費為25.6億美元,預計到2022年將增加至近110億美元。在本次大會上,眾多創新設計亮相,推動超大規模數據中心向深度和廣度發展。成員企業代表們表示,他們希望這些新項目只是芯片開源的一個開始。
微軟和合作伙伴發布了開源RTL,用于一種新的數據壓縮機制,而英特爾公布了另一個實現安全塊的類似項目。這些舉措表明,參與開放計算項目(Open Compute Project,OCP)的數據中心巨頭們,正在朝著芯片開源邁出第一步。
當下,摩爾定律正在放緩,深度學習等工作負載不斷增加,這迫使工程師們全力以赴追求性能提升。OCP大會參展廠商高管表示,由于目前有十幾款熱門處理器和加速器正在研發中,因此希望OCP委員會能夠在明年之前起草相關的標準。
微軟服務器設計總經理Kushagra Vaid表示:“在云服務提供商中,我們開創了貢獻RTL的先例。對于一項新的壓縮標準來說,你需要為整個行業做出貢獻,你需要大量的芯片。”
Project Zipline是對所謂“數據洪流”的一種響應措施,根據最近的一項研究顯示,預計到2025年每年產生的數據量將達到175ZB。Project Zipline定義了優化數據中心的霍夫曼編碼的一種變體,在模式匹配的IP塊中實現的。Project Zipline將微軟測試文件大小減少了了92%-96%,同時可以在微秒級處理吞吐量達每秒數十GB。
Vaid坦言,推出新的壓縮技術需要一定的時間。到目前為止,Project Zipline得到了AMD、Arm,Broadcom、Cadence、Intel、Marvell、Mellanox和Synopsys等廠商的支持。
在另一個項目Project Cerberus中,OCP的目標是將使用Project Cerberus創建的處理器信任根擴展到服務器的所有組件中,這就需要Facebook、Intel和微軟等廠商定義一個新的協議和IP塊。這種方法讓目前Cerberus主板上使用的NXP控制器成為主控制器,與每個外圍芯片中的從屬塊進行通信。英特爾發言人表示,這幾家廠商將開放這些外圍塊的源代碼。
重新思考服務器主板
在會上,微軟工程師Siamak Tavallaei描述了一種針對模塊化主板的新概念:將服務器主板分解為多個模塊,以降低成本并縮短設計時間。該項目負責人Siamak Tavallaei已經公布了這一概念的高級描述內容,并且已經有十幾家企業有興趣在今年夏天設計出原型。
這種方法讓處理器和內存變成了一個模塊,可以在定義好芯片后立即開始設計。各種CPU模塊都可以采用一種安全控制器模塊,這種模塊運行固件、監控溫度、控制風扇和其他基本事務。
采用基于PCIe Gen 4的I/O線纜,可以有助于減少電路板空間并縮短處理器與I/O之間的距離。距離縮短可以節省高達60%的PCB材料,并在機箱中騰出更多空間,用于容納更多端口、PCIe插槽、甚至是GPU等加速器。
各種服務器機架創新液冷方案亮相大會
隨著處理器和加速器變得體積更大,散熱更多,各種替代性的冷卻系統也開始風靡。在今年的大會上,參會者看到了各種各樣的熱管、泵和更奇特的冷卻技術。
臺灣的WiWynn公司展示了一種兩相(液體到蒸汽)浸沒系統,可以冷卻48-V Facebook Diablo Pass服務器的100個節點。
除了一些網絡巨頭正在自主研發的解決方案之外,市場中現有多達十幾種液冷產品,甚至是浸入式系統,現在也有多達八個競爭公司展示了他們的單相或者雙相系統。
浸入式系統廠商Submer表示,他們目前在測試4兆瓦的系統,預計將在幾天內公布10兆瓦的首個部署案例。
在LinkedIn的展位上,Zutacore展示了多個解決方案,從用于1U服務器的管道,到用于機架和熱交換裝置(看起來就像是有著金屬外殼的汽車散熱器)的液冷系統。
Emerald Pool:一臺服務器可容納8個加速器
Facebook的Emerald Pool是一種針對可容納8個加速器的機械和電氣參考服務器設計,目前采用的是PCIe Gen 3總線。Facebook正在醞釀明年推出大量的加速器。
例如,Facebook正在與Broadcom和Verisilicon合作開發一款用于視頻轉碼器的ASIC,它可以處理各種任務,包括處理來自手機的不穩定上傳,到Facebook Watch的下一個系列。Facebook技術戰略總監Vijay Rao表示,它兼容H.264、VP9和AV1等多種編碼器。芯片方面需要在10W的60幀/秒的速度下處理兩個4K流,并且并行編碼多個流,此外還需要支持ffmpeg和VAPI標準。
對于AI推理任務來說,Facebook希望芯片能夠達到至少5 TOPS/W的性能。目前Facebook正在與Esperanto、Habana、Intel、Marvell和Qualcomm圍繞用于推理任務的開源Glow編譯器展開合作。
Arm仍在試圖切入數據中心服務器市場
微軟正在將AMD Naples服務器添加到自己的數據中心x86陣容中,但到目前為止,微軟還無法將Arm服務器投入生產環境。如何讓復雜云軟件堆棧中的依存關系變得易管理,Vaid希望可以在一年時間內解決這個問題。
Marvell的ThunderX2是高通取消Centriq之后唯一的候選芯片。但是,微軟有望在新的Ampere芯片上市之后對其進行測試。
華為展示了自己1月份推出的雙路Arm服務器,現在華為提供了每個插槽有64個定制Arm核心的樣品。
微軟致力于簡化SSD控制器
在存儲方面,Facebook和微軟正在測試英特爾Optane存儲,但是并沒有披露測試結果。微軟展示了一款功耗為400W的256TB 1U閃存陣列,計劃在下個月投入生產時采用32個英特爾代號Ruler的16TB 3D NAND卡。
Vaid展示了一個Project Denali主板,它將大多數固件作業推送到服務器,將SSD控制器縮小到僅管理NAND介質的簡單芯片,從而節省資金并簡化管理。
Facebook的12.8T交換機采用Broadcom芯片
在網絡方面,Mediatek的Nephos部門公布了自己的6.4Tbits/s交換芯片所贏得的10個設計獎項,其中一些設計已經在位于中國和美國的數據中心運行。Nephos已經生產出了一款12.8Tbits/s多芯片器件,采用TSMC的7納米工藝及InFO封裝。
Innovium公司表示,他們正在生產自己的12.8T芯片,今年該芯片設計被思科兩款交換機采用。Broadcom公司也在發售自己的12.8T Tomhawk-3,但還沒有采用7納米芯片。與此同時,諾基亞也在參與一個面向用于電信邊緣網絡的標準機箱OCP項目,目前主板和機械設計已經開源貢獻給Open Edge。
Facebook則展示了最新的交換機設計——Minipack,該涉及采用了Broadcom的Tomahawk-3芯片和設備,為25G光纖端口提供服務。此外,Facebook還公布了一個新的數據中心拓撲結構,將四層折疊改為三層堆疊,以節省成本并減少跳數,提升數據中心的運行效率。
本文章選自《AI啟示錄》雜志,閱讀更多雜志內容,請掃描下方二維碼






