
エンタープライズ向けDPU(データ処理ユニット)のベストソリューション
データ処理ユニットとSmartNICは、データセンターに革命を起こしています。DPUは、ネットワーク、ストレージ、セキュリティの機能をサーバーのCPUからオフロードすることで、サーバーを高速化し、既存のハードウェアからより多くのパフォーマンスを引き出すことができます。用語については、DPUとSmartNICは非常に似ていますが、これらのソリューションの命名方法については意見が分かれています。SmartNICと呼ぶ企業もあれば、DPUと呼ぶ企業もあります。では、現在市場に出回っているDPUの中で、最も優れたものは何なのでしょうか。本稿では、現在ソリューションを提供している各ベンダーの中から、エンタープライズ向けDPU(データ処理ユニット)のベストソリューションをいくつかご紹介します。
1. Xilinx Alveo SmartNIC

出典:Xilinx
Xilinxが提供するAlveoシリーズのSmartNICは、FPGAをベースとしたプラットフォームであり、ハードウェアアクセラレーションを可能にし、不要なデータ移動を回避します。Xilinx Alveoは、機械学習推論、データ分析、ビデオトランスコーディング、その他多くのワークロードを含む、計算集約型アプリケーションを加速することができます。Xilinxは、Alveoシリーズがこれらのワークロードにおいて、CPUが実行できるよりも90倍高いパフォーマンスを発揮できると推定しています。AlveoシリーズのSmartNICは、ユーザーの特定の要件に応じて再プログラムできるため、適応性に優れています。これにより、ユーザーはハードウェアを変更することなく任意のワークロードを加速することができ、総所有コストを削減できます。再プログラム可能性は非常に重要であり、特にアルゴリズムがシリコン設計サイクルよりも速く進化するため、変化するアルゴリズムに適応できる再プログラム可能なハードウェアが必要となります。Xilinxが提供するDPU/SmartNICの1つであるAlveo U250は、最大64GBのECC RAM、2つの100ギガビットRJ45イーサネットポート、および最大8GT/sで動作する16レーンのPCI Express 3.0への接続が可能です。Alveo U250は、データ処理、ネットワーキング、セキュリティ機能など、一般的な計算集約型機能をホストサーバーのCPUからDPUにオフロードすることができます。
Xilinx Alveo U25
- 10Gbイーサネット x2、または25Gbイーサネット x2
- RAM 2GB~4GB DDR4-2400
- PCIe Gen 3 x16
- 75W TDP
- パッシブ冷却
- PXEおよびUEFIをサポート
Xilinx Alveo U50
- 100ギガビット・イーサネット x1
- HBM2 – 8GB容量
- PCIe Gen 3 x16
- 75W TDP
- パッシブ冷却
- PXEおよびUEFIをサポート
Xilinx Alveo U200
- 100ギガビット・イーサネット x2
- 64GB DDR4 RAM
- PCIe Gen 3 x16
- 225W TDP
- アクティブ冷却
- PXEおよびUEFIをサポート
Xilinx Alveo U250
- 100ギガビット・イーサネット x2
- 64GB DDR4 RAM
- PCIe Gen 3 x16
- 225W TDP
- アクティブ冷却
- PXEおよびUEFIをサポート
2. Nvidia Mellanox BlueField 2 DPU

出典:Nvidia
Nvidiaは、業界をリードするConnectXネットワークアダプター、強力なマルチコアプロセッサー、その他の多くのパフォーマンスアクセラレーターを1つのパッケージに組み合わせたNvidia Mellanox BlueField 2データ処理ユニットを提供しています。このデバイスは再プログラム可能で、組織は最新のアルゴリズムを実行するためにデバイスを再プログラムできます。BlueField 2は、サーバーのCPUからDPUに主要なCPU機能の一部をオフロードすることで、ボトルネックを解消し、収益を生み出すエンタープライズアプリケーションのためにCPUサイクルを解放します。BlueField 2 DPUは、8つのARMv8コア、DDR4 RAM、インテリジェントイーサネットアダプターを搭載し、10/25/50/56/100ギガビット/秒の接続と最大32レーンのPCIe Gen 3.0/4.0をサポートしています。BlueField 2 DPUは、オールフラッシュアレイ、データ圧縮、データ解凍、重複排除などのストレージアプリケーションにも対応できます。
さらに、このDPUは、ストレージコントローラーのタスクをメインホストCPUからデータ処理ユニット自体にオフロードすることで処理できます。さらに、RDMAベースの機能により、PCのオーバーヘッドを最小限に抑えながら、ローカルストレージと同等のリモートストレージアクセス性能を提供します。BlueField 2 DPUは、高性能ネットワークインターフェースで真価を発揮し、DPUがデータを解析、処理、転送できるようにすることで、ネットワーク全体の速度を向上させます。また、Mellanox BlueField 2は、機械学習や深層学習、ストレージ、電気通信などのAIタスクをオフロードおよび加速できるアクセラレーションエンジンを搭載しており、サーバーのCPUを他の収益を生み出すタスクに解放します。
Nvidia Mellanox BlueField 2 DPUの仕様
- 10/25/50/100ギガビットデュアルポート、または200ギガビットイーサネットポート x1
- 8GBまたは16GBのオンボードDDR4 RAM(ECCサポート付き)
- 8または16レーンのPCIe Gen 4.0接続
- 8つのARMv8コア
- セキュアブート
- リモートブート
3. Silicom FPGA SmartNIC N5010

出典(Silicom USA)
Silicom FPGA SmartNIC N5010は、Intel Stratix 10 FPGAを搭載したSmartNICです。N5010は、パケット処理とトラフィック管理に最適化できる高性能アクセラレータカードです。N5010は4x 100ギガビット/秒をサポートし、合計で最大500Gbpsを実現します。このSmartNICは、電気通信インフラの機能を含む、幅広い機能の高速化に使用できます。例えば、このSilicom SmartNICは、CPU負荷の高いタスクをサーバーのCPUからSmartNICにオフロードすることで、5Gネットワークサービスを改善・高速化するために使用できます。このようなタスクには、ネットワーク機能、セキュリティ機能、テレメトリー機能などがあります。メインシステムのCPUからSmartNICにタスクをオフロードすることで、サーバーのすべてのコアは、ディープパケットインスペクション、エンドポイント検出、アダプティブビットレートストリーミング、その他のアプリケーションなど、5Gアプリケーション向けの付加価値サービスの処理に集中できます。全体として、FPGAベースのSmartNICは、絶えず変化する通信ニーズに適応できるため、通信サービスプロバイダーに新機能を提供する柔軟性を手頃な価格で提供します。
Silicom FPGA SmartNIC N5010スペック
- 4x 100ギガビットイーサネット
- ECC付き32GB DDR4 RAM
- HBM 8GB
- PCIe Gen 4.0 x16
- パッシブまたはアクティブ冷却
- 225ワットTDP
4. Broadcom Stingray SmartNIC

出典 (Broadcom)
Broadcom Stingrayは、強力なネットワークコントローラ、高性能ARM CPU、PCI Express 3.0、パフォーマンスアクセラレータ、DDR4 RAMを組み合わせることで、ホストサーバーのCPUからSmartNICへ計算負荷の高いアプリケーションをオフロードします。Stingrayは、高いパケットレートと低い遅延を実現できます。Stingrayのパフォーマンスアクセラレータは、強力なパケット検査とハードウェア自体での処理能力を可能にし、組織が一般的なフロー処理ワークロードをサーバーのCPUからSmartNIC自体に移動する能力を提供し、サーバーのCPUを解放して収益を生むアプリケーションを実行できるようにします。
Stingray SmartNICスペック
- 8x ARM A72コア @ 3.00GHz
- 1x 100ギガビットイーサネット
- 8GBまたは16GBのDDR4 RAM
- PCIe Gen 3.0 x8をサポート
- 暗号化エンジン
- セキュアブート
5. Marvell Octeon Liquid I/O III SmartNIC

出典 (Marvell)
Marvellは、インラインネットワークおよびセキュリティ高速化のためにLiquidIO III SmartNICを提供しています。LiquidIO IIIは、LinuxとDPDKをベースにした完全なネットワークソフトウェアスタックをサポートしています。LiquidIO SmartNICはPCI Expressフォームファクタを採用しており、データセンターはデータセンター内の特定のワークロードをオフロードおよび高速化できます。付属のネットワークアダプタは、キュー管理、パケットマーキング、輻輳通知、および優先度ベースのスケジューリングに基づいて、トラフィックを管理、スケジュール、制御、および優先順位付けする機能を備えています。Liquid IO IIIは、ホストシステムのCPUからSmartNICへさまざまな機能をオフロードし、貴重なCPUサイクルを他の優先度の高いアプリケーションのために解放できます。さらに、暗号化操作、パケット処理、セキュリティプロトコル、仮想スイッチ、トラフィック管理、およびトンネリング機能をオフロードおよび高速化できます。
LiquidIO IIIスペック
- 36個のARMv8コアを搭載したマルチコアプロセッサ @ 2.2GHz
- 16GB DDR4 + ECC RAM
- 最大5x 100ギガビットイーサネットポートまたは2x 50ギガビットイーサネットポート
- PCIe Gen 4.0 x16をサポート
6. Fungible DPU

出典 (Fungible)
Fungible DPUは、データセンター内のデータ中心ワークロードの処理を高速化するように設計されています。Fungible DPUは、データトラフィックコントローラとして機能し、ネットワークトラフィックをCPUとGPUに移動します。このデータ処理ユニットは、DPU対応のコンピューティングサーバーとストレージサーバー間で高速データセンターファブリックを可能にします。Fungible DPUの主な利点は、データセンターがコンピューティング要素とストレージ要素を切り離すことを可能にし、サーバーの物理的な制限を取り除き、データセンターのリソースを高速データファブリック上で動的にプールおよび集約できるようにすることです。全体として、Fungible DPUは、CPU、FPGA、GPU、SSD、HDD向けのTrue Fabricを介した動的な構成可能性とリソースプールに最適であり、これらのリソースを安全で低遅延のTrue Fabricを介して多くのリモートサーバー間で共有できます。
Fungible F1 DPU仕様
- 最新世代のMIPS64—52コア @ 1.6GHz
- 64 PCIe Gen3/Gen4レーン
- 16個のデュアルモード設定可能コントローラ
- プログラム可能なDMAエンジン
- ECC付き8GB HBMモジュール
- ECC付きデュアルチャネルDDR4
- 10x100GE、10x 40GE、20x 50GE、40x 25GE、または40x 10GEポート
結論
このブログ記事からもわかるように、選択できるDPU(データ処理ユニット)はたくさんあります。DPUを選択する際には、ソリューションのコア数、アクセラレーションエンジン、RAM、およびイーサネット接続を考慮する必要があります。サーバーには複数のDPUを搭載できるため、単一のDPUの性能が不十分な場合は、追加のDPUでDPUサーバーを構成できます。DPUサーバーの選択でお困りの場合は、当社のDPUサーバーの専門家にお問い合わせください。お客様の特定の要件を満たすソリューションの選択を支援いたします。さらに、Premioは30年以上にわたり米国でサーバーと組み込みコンピューティングソリューションを製造しており、信頼性と堅牢性の高いコンピューティングソリューションを提供する実績があります。
