
DPU 與資料中心
隨著儲存在資料中心伺服器上並被存取的資料量持續增加,對於效能加速器的需求也日益增加,以釋放伺服器 CPU 週期,用於執行企業應用程式和作業系統 (OS)。DPU 能夠釋放主機伺服器的 CPU 週期,因為網路、儲存和安全功能可以從 CPU 卸載到 DPU。DPU 能夠執行這些功能,因為它們配備了強大的多核處理器、加速器、網路介面控制器,有些選項還配備了 GPU。資料中心營運商正在轉向 DPU(資料處理單元)等效能加速器,因為摩爾定律的發展速度減緩,處理能力不再像過去那樣快速提升。DPU 允許資料中心營運商從現有的硬體中提取更多效能,而無需更換所有設備以獲得更高效能。
DPU 伺服器如何改善資料中心?
DPU 加速伺服器可以透過增加企業應用程式可用的處理能力來改善資料中心。這是因為將 DPU(資料處理單元)新增到伺服器中,允許伺服器將網路和儲存功能的處理卸載到 DPU,從而為關鍵任務應用程式和執行作業系統釋放寶貴的 CPU 處理能力。DPU 是一種新的可程式處理器類別,Nvidia 聲稱它們將成為資料中心的支柱,就像 CPU(中央處理單元)和 GPU(圖形處理單元)一樣。最近,GPU 也進入了資料中心,加速了人工智慧工作負載,例如機器學習和深度學習。GPU 在資料中心廣泛採用,因為它們具有巨大的平行處理能力,這歸功於 GPU 配備的數百或數千個核心。

現在,DPU 正在進入資料中心,釋放伺服器處理能力,因為網路和儲存功能從伺服器的主 CPU 卸載到 DPU。Nvidia 估計,大約 30% 的伺服器處理能力用於執行網路和儲存功能。因此,為資料中心伺服器配備 DPU 可以釋放寶貴的處理能力,用於執行作業系統和其他企業應用程式。總之,CPU 將用於通用運算,GPU 將用於加速受益於其大規模平行運算能力的特定工作負載,而 DPU 將用於接管儲存和網路功能,例如資料處理和資料在資料中心之間的移動。
隨著物聯網的爆炸性成長和 5G 連線的普及,數百萬個產生資料的新設備上線,資料中心中移動的資料量不斷增加,因此將需要 DPU 來加速資料中心伺服器執行的儲存和網路功能。那麼 DPU 究竟是什麼?我們將在下面詳細回答這個問題。
什麼是 DPU?
DPU,也稱為資料處理單元,由多核處理器(通常是 Arm 處理器)、能夠以極高速度(100 Gb/s 至 200 Gb/s)傳輸資料的網路介面控制器、一組加速應用程式效能的加速引擎和 RAM 記憶體組成。此外,Nvidia 提供了一款配備 Ampere GPU 的 DPU,用於執行包括機器學習和深度學習在內的人工智慧應用程式。更進一步,它可以使用人工智慧進行即時安全分析,包括識別異常流量,這有助於組織識別機密資料的竊取或網路上的惡意活動。儘管如此,DPU 的核心功能仍然是其接管網路和儲存任務的能力,包括隔離、根信任、金鑰管理、彈性區塊儲存、資料壓縮等等。

例如,Nvidia Mellanox BlueField 2 是一種資料處理單元,它將業界領先的 ConnectX 網路介面卡與數個 ARM 核心結合在一起,為資料中心提供先進的網路、儲存和安全功能。此外,BlueField 2 DPU 能夠以高達 200 Gbps 的速度傳輸資料,同時釋放資料中心伺服器核心,以加速創收服務的效能。
總體而言,DPU 的未來確實光明。這是因為隨著資料量不斷爆炸性增長,資料中心正在尋找從現有伺服器中提取更多效能的方法。為伺服器配備 DPU 可以將伺服器效能提高 30% 以上,因為它將網路和儲存功能從 CPU 卸載到 DPU,讓 DPU 管理資料在整個資料中心內的移動。這對資料中心營運商來說非常棒,因為它允許他們從現有硬體中提取更多效能,而無需更換所有設備。
資料處理單元的主要組成部分是什麼?
資料處理單元是一種 SoC(單晶片系統),具有以下組件:高效能網路介面控制器、軟體可程式化的多核處理器(Nvidia 使用 Arm 處理器)、隨機存取記憶體(RAM 高達 16GB)以及一套豐富的可程式效能加速器。高效能網路介面控制器負責處理、解析和傳輸整個資料中心的資料。
DPU 常見功能:
- 透過板載 100 Gb/s 至 200 Gb/s 介面實現極高速連線能力
- 高速封包處理
- 多核強大 CPU
- 支援 DDR4 或 DDR5 RAM
- 效能加速器
- 支援 PCI Express 4.0
- 安全功能
- 資料和儲存管理功能
為什麼 DPU 伺服器越來越受歡迎?
DPU 伺服器越來越受歡迎,因為如前所述,DPU 伺服器比一般資料中心伺服器功能更強大。這是因為 DPU 加速伺服器可以將所有網路和儲存功能卸載到 DPU,從而釋放伺服器中的處理能力,用於執行企業應用程式。隨著越來越多資料進入資料中心,增加處理能力的重要性持續增長。資料中心伺服器必須具備足夠的處理能力來處理和分析傳入的資料。其中一種方法是將網路和儲存功能卸載到 DPU。DPU 專門針對資料在資料中心內東西向移動進行優化。
由於摩爾定律的發展速度減緩,無法透過增加 CPU 效能來應對資料量的增加,因此需要專用的硬體(例如 DPU)來管理資料流和處理。事實上,Intel、Google 和 Microsoft 正在將資料處理單元視為應對資料爆炸性增長的可能解決方案。
因此,隨著資料量和速度的增加,DPU 伺服器越來越受歡迎,因為它們可以處理與資料相關的工作負載,例如加密和保護,將這些工作從 CPU 卸載到 DPU。這使得 CPU 可以專注於執行作業系統 (OS) 和企業應用程式,從而提高伺服器的整體效能,同時也帶來儲存和網路方面的改進。
DPU 伺服器的常見配置有哪些?
讓我們探討一些不同的伺服器配置。所有這些項目都可以除了資料處理單元之外,也添加到伺服器中。
1. 運算能力
高效能伺服器可配備雙 Intel Xeon SP(可擴充處理器),每個處理器最多具有 28 個核心和 56 個執行緒。Xeon 處理器提供極快的效能,可協助組織滿足資料中心對提供快速資料儲存和存取日益增長的需求。此外,高核心數處理器還能實現新服務,在企業、技術運算、儲存和雲端中提供新應用程式。此外,Intel Xeon 處理器在效能、能源效率、安全性和虛擬化方面提供顯著的優勢。此外,伺服器還可以透過雙 AMD Epyc 處理器進行配置,每個處理器具有 64 個核心和 128 個執行緒,總共提供 128 個核心和 256 個執行緒的超快速處理能力。此外,如果您的工作負載不需要這麼多的處理能力,我們還提供可以配置單個 AMD Epyc 處理器的伺服器。
2. 高效能儲存
Premio 伺服器可配備高效能儲存,其中包括 NVMe 儲存,提供高儲存傳輸量效能和應用程式回應能力。配備 NVMe 儲存的伺服器比仍然使用 SATA 和 SAS 互連的舊版解決方案快得多。NVMe SSD 直接插入伺服器的 PCIe 匯流排,與插入 SATA 控制器的 SSD 相比,在效能方面顯著提升,延遲也顯著降低。隨著儲存和存取資料量持續增加,對更快的處理和更大容量的高速資料儲存的需求也隨之增加。
3. 高速網路連線
高效能 DPU 伺服器透過主機板和 DPU 本身的乙太網路 LAN 連接埠提供大量的連線能力。主機板本身配備 2 個 Gigabit 乙太網路連接埠和 1 個單一管理連接埠。然而,可用的連線數量取決於您系統中資料處理單元和常規 NIC 的數量。以下是一些最受歡迎的 DPU 的效能規格:
- Xilinx Alveo U25 – 2 個 25 Gigabit 乙太網路連接埠
- Xilinx Alveo U50 – 1 個 100 Gigabit 乙太網路連接埠
- Xilinx Alveo U 200 – 2 個 100 Gigabit 乙太網路連接埠
- Xilinx Alveo U250 – 2 個 100 Gigabit 乙太網路連接埠
- Xilinx Alveo U280 – 2 個 100 Gigabit 乙太網路連接埠
- Nvidia Mellanox BlueField 2 – 雙連接埠,支援 10/25/50/100 Gigabit 或單一連接埠,支援 200 Gigabit
- Silicom FPGA SmartNIC N5010 系列 – 4 個 100 Gigabit 乙太網路連接埠
注意:我們提供支援 SFP28 進行 10/25 Gigabit 連線或 QFSP28 進行 100/200 Gigabit 連線選項。
平衡 PCIe 架構
DPU 伺服器採用經過最佳化以平衡儲存和網路頻寬的傳輸量配置。因此,即使連接的儲存驅動器提供比網路更快的速度,從兩端處理的資料量也會相等,為組織提供儲存和網路 I/O 相匹配的均衡設計。此外,平衡的 PCIe 架構為具有高資料平行性並同時使用 CPU 和 DPU 處理工作負載的程式碼提供平衡的效能,確保您的伺服器以最佳狀態運作。
CPU、GPU 和 DPU 之間有什麼區別?
CPU 的設計和製造旨在盡可能快速地執行各種任務,使其用途廣泛。CPU 具有大型、廣泛的指令集,可指示 CPU 切換相關電晶體以執行其需要完成的任務。另一方面,GPU 沒有如此廣泛的指令集,但它們在某些應用程式中比 CPU 具有優勢。GPU 的核心數量比 CPU 多得多。例如,典型的 CPU 處理器有 4 到 10 個核心,有些伺服器 CPU 最多有 64 個核心,而典型的 GPU 可以有數百或數千個較小的核心。例如,RTX 3080 有超過 8700 個核心。因此,儘管 CPU 比 GPU 更智慧,但 GPU 核心的純粹數量和所提供的平行性使其成為執行大量數學運算的應用程式的絕佳選擇。

最初,GPU(圖形處理單元)用於提供豐富、即時的圖形;然而,觀察者發現 GPU 也可以加速特定的應用程式。受益於 GPU 的應用程式包括機器學習、深度學習、風險建模、金融模擬和許多其他科學計算。正如 GPU 能夠加速人工智慧工作負載一樣,DPU 也能夠透過將網路和儲存功能從 CPU 卸載到 DPU 來加速網路和儲存功能。DPU 非常適合管理資料中心內資料的移動。
最常見的 DPU 解決方案有哪些?
Nvidia 發布了一款名為 Nvidia Mellanox BlueField 2 資料處理單元 (DPU) 的 DPU。此外,Nvidia 還發布了 Mellanox BlueField 2X DPU,該 DPU 具有與 BlueField 2 DPU 相同的特性,並增加了 Ampere GPU。Ampere GPU 可用於運行人工智慧應用程式,例如安全異常檢測,以檢測和預防網路入侵。如果這還不夠,Nvidia 已經計劃在 2022 年發布 BlueField 3,並在 2023 年發布 BlueField 4。
此外,Intel 和 Xilinx 也將其 DPU 引入了該領域;然而,他們將資料處理單元稱為 SmartNIC。Xilinx 和 Intel 的解決方案都將 FPGA 與網路介面控制器結合,以加速網路和儲存功能,就像 DPU 一樣。
例如,Intel 與 Silicom 合作提供 Silicom FPGA SmartNIC N5010,該產品是透過將 Intel Stratix 10 FPGA 與 Intel Ethernet 800 系列介面卡結合而成,透過包含 4 個 100 Gigabit 乙太網路連接埠提供充足的頻寬。也就是說,Xilinx 提供 ALVEO 系列 SmartNIC,透過將網路、儲存和運算功能卸載到 Xilinx SmartNIC 來提升資料中心的效能水平。Xilinx Alveo U25 基於 FPGA 平台,提供超高傳輸量和低延遲,同時避免不必要的資料移動和 CPU 處理。
資料中心伺服器中還使用了哪些其他效能加速器?
1. GPU(圖形處理單元)

資料來源 (Nvidia)
資料中心中常見的其他效能加速器包括 GPU(圖形處理單元)、運算儲存裝置 (CSD) 和 FPGA(現場可程式閘陣列)。GPU(圖形處理單元)經常用於資料中心伺服器,以加速複雜的數學工作負載。由於包含數千個小型核心,GPU 在執行數學工作負載方面表現出色,使其能夠並行執行許多任務和運算。因此,圖形處理單元非常適合人工智慧、深度學習、機器學習、高解析度視訊編輯、醫學影像和許多其他要求嚴苛的工作負載。
2. 運算儲存裝置 (CSD)

資料來源 (Anandtech)
運算儲存應用於資料中心,可作為效能加速器。運算儲存可加快伺服器效能,因為它能讓伺服器在儲存裝置層級處理資料,提供企業即時資料分析的能力,且延遲盡可能低,同時減少輸入/輸出瓶頸。運算儲存裝置看起來與一般儲存裝置相似,但它們配備多核心處理器,可在儲存裝置本身處理和分析資料,使企業能夠在儲存裝置層級提取有價值、可操作的見解。此外,為伺服器配備運算儲存裝置可減少延遲,因為資料可在儲存裝置本身進行近乎即時的處理和分析。而且,由於資料無需移除並保留在儲存裝置上,這可透過減少漏洞來增加安全性。
3. 場域可程式邏輯閘陣列 (FPGA)

資料來源 (Xilinx)
FPGA 是由邏輯閘、I/O 單元和其他資源組成的積體電路,使用者可以根據其特定要求,以不同的配置重新編程和重新配置晶片。FPGA 廣泛應用於機器學習和深度學習工作負載。此外,FPGA 也應用於 SmartNIC,透過 FPGA 龐大的平行處理能力,將網路功能加速數個數量級,這得益於 FPGA 提供的高效能、高頻寬和高吞吐量。總體而言,FPGA SmartNIC 與 DPU 相似,因為它們可以將網路和儲存功能從伺服器的 CPU 卸載到獨立的專用硬體上執行,從而釋放出寶貴的 CPU 處理能力。
結論
此刻,DPU(資料處理單元)將在資料中心普及,這應該不令人意外,因為進入資料中心的資料量持續增加,迫使資料中心最大限度地提高其系統的效能,以應對資料的湧入。DPU 允許資料中心營運商透過將儲存和網路功能從主機系統卸載到資料處理單元,從而從其伺服器中提取更多效能。Nvidia 聲稱,單一 BlueField 2 DPU 可以處理相同的資料中心服務,而這些服務原本需要 125 個 CPU 核心。Premio 在美國製造電腦已超過 30 年,提供各種高效能 DPU 伺服器,可根據您的特定要求進行客製化。如果您需要協助選擇 DPU 伺服器或客製化解決方案,請聯繫我們,我們的一位伺服器專業人員將協助您找到符合您特定要求的解決方案。
探索 以下 DPU 加速伺服器
Premio 提供多種高效能 DPU 伺服器;其中一款伺服器是 Flache Streams DPU 伺服器。此伺服器可配置多達 18 個資料處理單元 (DPU)、高速 NVMe SSD 儲存,以及雙 Intel Xeon 處理器、雙 AMD Epyc 處理器或單一 AMD Epyc 處理器。此外,伺服器可配置高速 NVMe SSD 和透過 SATA 連接的常規 SSD 儲存。資料處理單元用於將部分網路、儲存和安全功能從伺服器的主 CPU 卸載到 DPU,釋放出寶貴的處理能力以執行產生收入的企業應用程式。例如,您可以將我們的其中一台 DPU 伺服器配置多個 Mellanox BlueField 2 DPU、PCIe NVMe 儲存和雙 Intel Xeon SP(可擴展處理器),為您提供充足的 CPU 處理能力、高速固態儲存,以及由於包含資料處理單元而提供的大量網路功能。
