
最佳企業級 DPU(資料處理單元)
資料處理單元與智慧網路卡正透過提升伺服器速度徹底改變全球資料中心,讓組織能透過將網路、儲存與安全功能從伺服器 CPU 卸載到 DPU,從現有的硬體中取得更高的效能。談到術語時,DPU 與智慧網路卡驚人地相似,但組織尚未針對這些解決方案達成命名方案的共識,一些組織稱其為智慧網路卡,另一些則稱其為 DPU。因此,您可能想知道,目前市面上最好的 DPU 是哪些?我們將向您介紹目前由不同解決方案供應商提供的最佳企業級 DPU(資料處理單元):
1. Xilinx Alveo 智慧網路卡

資料來源:Xilinx
Xilinx 提供的 Alveo 系列智慧網路卡是基於 FPGA 的平台,可實現硬體加速並避免不必要的資料移動。Xilinx Alveo 能夠加速計算密集型應用程式,包括機器學習推斷、資料分析、視訊轉碼以及許多其他工作負載。Xilinx 估計 Alveo 系列在這些工作負載上的效能比 CPU 高 90 倍。Alveo 系列智慧網路卡具有可適應性,這歸功於使用者能夠根據其特定要求對其進行重新編程。這允許使用者加速任何工作負載,而無需更換硬體,從而降低總擁有成本。可重編程性非常重要,特別是在考慮到演算法比晶片設計週期進化得更快時,需要可重編程的硬體來適應不斷變化的演算法。Xilinx 提供的 DPU/智慧網路卡之一是 Alveo U250,它可以配置高達 64 GB 的 ECC RAM、2 個 100 千兆位元 RJ45 乙太網埠,以及連接到 16 個 PCI Express 3.0 通道的能力,運行速度高達 8 GT/s。Alveo U250 能夠將常見的計算密集型功能(例如資料處理、網路和安全功能)從主機伺服器的 CPU 卸載到 DPU。
Xilinx Alveo U25
- 2 個 10 Gigabit 或 2 個 25 Gigabit 乙太網路
- RAM 2GB 至 4GB DDR4-2400
- PCIe Gen 3 x16
- 75W TDP
- 被動冷卻
- 支援 PXE 和 UEFI
Xilinx Alveo U50
- 1 個 100 Gigabit 乙太網路
- HBM2 – 8GB 容量
- PCIe Gen 3 x16
- 75W TDP
- 被動冷卻
- 支援 PXE 和 UEFI
Xilinx Alveo U200
- 2 個 100 Gigabit 乙太網路
- 64GB DDR4 RAM
- PCIe Gen 3 x16
- 225W TDP
- 主動冷卻
- 支援 PXE 和 UEFI
Xilinx Alveo U250
- 2 個 100 Gigabit 乙太網路
- 64GB DDR4 RAM
- PCIe Gen 3 x16
- 225W TDP
- 主動冷卻
- 支援 PXE 和 UEFI
2. Nvidia Mellanox BlueField 2 DPU

資料來源:Nvidia
Nvidia 提供的 Nvidia Mellanox BlueField 2 資料處理單元結合了業界領先的 ConnectX 網路卡、強大的多核心處理器,以及多個其他效能加速器,形成一個可重新編程的單一封裝,允許組織重新編程該設備以運行最新的演算法。BlueField 2 可以將一些主要的 CPU 功能從伺服器的 CPU 卸載到 DPU,從而克服瓶頸並釋放 CPU 週期以用於產生收入的企業應用程式。BlueField 2 DPU 配備 8 個 ARMv8 核心、DDR4 RAM 和智慧型乙太網路轉接卡,支援 10/25/50/56/100 Gigabit/s 連接和高達 32 個 PCIe Gen 3.0/4.0 通道。BlueField 2 DPU 可以處理儲存應用程式,例如全快閃陣列、資料壓縮、資料解壓縮和重複資料刪除。
此外,此 DPU 可以透過將儲存控制器任務從主機 CPU 卸載到資料處理單元本身來處理儲存控制器任務。此外,它配備基於 RDMA 的技術,可提供與本地儲存相同效能的遠端儲存存取,且 PC 開銷極小。BlueField 2 DPU 在高效能網路介面方面表現出色,使 DPU 能夠解析、處理和傳輸資料,從而加速網路的其餘部分。此外,Mellanox BlueField 2 配備了加速引擎,可以卸載和加速 AI 任務,例如機器學習和深度學習、儲存和電信,從而釋放伺服器的 CPU 來執行其他產生收入的任務。
Nvidia Mellanox BlueField 2 DPU 規格
- 雙埠 10/25/50/100 千兆位元或 1 個 200 千兆位元乙太網路埠
- 8GB 或 16GB 板載 DDR4 RAM,支援 ECC
- 8 或 16 個 PCIe Gen 4.0 連線通道
- 8 個 ARMv8 核心
- 安全啟動
- 遠端啟動
3. Silicom FPGA 智慧網路卡 N5010

資料來源 (Silicom USA)
Silicom FPGA SmartNIC N5010 是一款採用 Intel Stratix 10 FPGA 構建的 SmartNIC。N5010 是一款高效能加速卡,可最佳化以處理封包和管理流量。N5010 支援 4x 100 Gigabit/s,總計可達 500Gbps。此 SmartNIC 可用於加速多種功能,包括電信基礎設施中的功能。例如,此 Silicom SmartNIC 可用於透過將伺服器 CPU 的CPU 密集型任務卸載到 SmartNIC,從而改進和加速 5G 網路服務,此類任務包括網路功能、安全功能和遙測功能。透過將主系統 CPU 的任務卸載到 SmartNIC,所有伺服器核心都可專注於處理 5G 應用程式的增值服務,例如深度封包檢測、端點檢測、自適應位元率串流和其餘應用程式。總體而言,基於 FPGA 的 SmartNIC 由於能夠以實惠的價格適應不斷變化的通訊需求,因此為通訊服務供應商提供了提供新功能的靈活性
Silicom FPGA SmartNIC N5010 規格
- 4x 100 Gigabit 乙太網路
- 32GB 帶 ECC 的 DDR4 RAM
- HBM 8GB
- PCIe Gen 4.0 x16
- 被動或主動冷卻
- 225 瓦 TDP
4. Broadcom Stingray SmartNIC

來源 (Broadcom)
Broadcom Stingray 結合了強大的網路控制器、高效能 ARM CPU、PCI Express 3.0、效能加速器和 DDR4 RAM,可將運算密集型應用程式從主伺服器 CPU 卸載到SmartNIC。Stingray 能夠提供高封包速率和低延遲。Stingray 效能加速器使其能夠執行強大的封包檢測,並在硬體本身提供處理能力,讓組織能夠將常見的流處理工作負載從伺服器 CPU 轉移到SmartNIC本身,從而釋放伺服器 CPU 以執行產生收益的應用程式。
Stingray SmartNIC 規格
- 8x ARM A72 核心,3.00GHz
- 1x 100 Gigabit 乙太網路
- 8GB 或 16GB 的 DDR4 RAM
- 支援 PCIe Gen 3.0 x8
- 加密引擎
- 安全開機
5. Marvell Octeon Liquid I/O III SmartNIC

來源 (Marvell)
Marvell 提供 LiquidIO III SmartNIC 用於內聯網路和安全加速。LiquidIO III 支援基於 Linux 和 DPDK 的完整網路軟體堆疊。LiquidIO SmartNIC 採用 PCI Express 外形,使資料中心能夠卸載和加速資料中心中的某些工作負載。隨附的網路轉接器能夠根據佇列管理、封包標記、擁塞通知和基於優先順序的排程來管理、排程、引導和優先處理流量。Liquid IO III 能夠將各種功能從主機系統 CPU 卸載到 SmartNIC,從而釋放寶貴的 CPU 週期以用於其他高優先順序應用程式。此外,它還可以卸載和加速加密操作、封包處理、安全協定、虛擬交換機、流量管理和隧道功能。
LiquidIO III 規格
- 多核心處理器,36 個 ARMv8 核心,2.2GHz
- 16GB DDR4 + ECC RAM
- 最多 5 個 100 Gigabit 乙太網路埠或 2 個 50 Gigabit 乙太網路埠
- 支援 PCIe Gen 4.0 x16
6. Fungible DPU

來源 (Fungible)
Fungible DPU 旨在加速資料中心內以資料為中心的工作負載處理。Fungible DPU 作為資料流量控制器,將網路流量轉移到 CPU 和 GPU。此資料處理單元可在啟用 DPU 的運算和儲存伺服器之間實現高速資料中心網狀架構。Fungible DPU 的主要優勢在於它允許資料中心分離運算和儲存元素,消除伺服器的實體限制,允許資料中心資源透過高速資料網狀架構動態地匯集和聚合。總體而言,Fungible DPU 非常適合透過True Fabric 為 CPU、FPGA、GPU、SSD 和 HDD 進行動態組合和資源匯集,從而使這些資源能夠透過安全、低延遲的 True Fabric 在許多遠端伺服器之間共用。
Fungible F1 DPU 規格
- 最新一代 MIPS64—52 核心,1.6GHz
- 64 個 PCIe Gen3/Gen4 通道
- 16 個雙模式可設定控制器
- 可程式設計 DMA 引擎
- 8GB 帶 ECC 的 HBM 模組
- 雙通道 DDR4 帶 ECC
- 10 個 100GE、10 個 40GE、20 個 50GE 或 40 個 25GE 或 40 個 10GE 埠
總結
從這篇部落格文章中可以看出,您有許多 DPU (資料處理單元) 可供選擇。選擇 DPU 時,您應該考慮解決方案的核心數量、加速引擎、RAM 和乙太網路連接。請記住,伺服器可以配備多個 DPU,因此如果單個 DPU 的功能不足,您可以為您的 DPU 伺服器 配置額外的 DPU。如果您在選擇 DPU 伺服器 時需要協助,您應該聯繫我們的 DPU 伺服器專業人士,他們將協助您選擇符合您特定需求的解決方案。此外,Premio 在美國製造伺服器和嵌入式運算解決方案已超過 30 年,因此他們在提供可靠且強大的運算解決方案方面擁有良好的記錄。
