
DPUとデータセンター
データセンターのサーバーに保存され、アクセスされるデータの量が増え続けるにつれて、エンタープライズアプリケーションやオペレーティングシステム(OS)を実行するために、サーバーのCPUサイクルを解放するパフォーマンスアクセラレータの必要性が高まっています。DPUは、ネットワーク、ストレージ、セキュリティ機能をCPUからDPUにオフロードできるため、ホストサーバーのCPUサイクルを解放できます。DPUは、強力なマルチコアプロセッサ、アクセラレータ、ネットワークインターフェイスコントローラを備えており、一部のオプションにはGPUも搭載されているため、これらの機能を実行できます。データセンターのオペレータは、ムーアの法則が減速し、処理能力が以前ほど進歩していないため、DPU(データ処理ユニット)などのパフォーマンスアクセラレータに目を向けています。DPUは、データセンターのオペレータが既存のハードウェアからより多くの電力を引き出し、より多くのパフォーマンスを得るためにすべての機器を交換する必要がないようにします。
DPUサーバーはデータセンターをどのように改善できますか?
DPUアクセラレーションサーバーは、エンタープライズアプリケーションで使用可能な処理能力を増やすことで、データセンターを改善できます。これは、DPU(データ処理ユニット)をサーバーに追加することで、ネットワークおよびストレージ機能の処理をDPUにオフロードし、ミッションクリティカルなアプリケーションやオペレーティングシステムを実行するための貴重なCPU処理能力を解放できるためです。DPUは、CPU(中央処理装置)やGPU(グラフィックス処理装置)と同様に、データセンターの主役となるであろうとNvidiaが主張する新しいプログラマブルプロセッサのクラスです。最近、GPUはデータセンターに導入され、機械学習やディープラーニングなどのAIワークロードを加速させています。GPUは、数百または数千のコアを備えているため、その大規模な並列処理能力によってデータセンターで広く採用されました。

現在、DPUはデータセンターに導入されており、ネットワークとストレージの機能がサーバーのメインCPUからDPUにオフロードされるため、サーバーの処理能力を解放しています。Nvidiaは、サーバーの処理能力の約30%がネットワークおよびストレージ機能の実行に費やされていると推定しています。したがって、データセンターサーバーにDPUを装備すると、OSやその他のエンタープライズアプリケーションを実行するための貴重な処理能力が解放されます。まとめると、CPUは汎用コンピューティングに使用され、GPUはその大規模な並列コンピューティング能力の恩恵を受ける特定のワークロードを加速するために使用され、DPUはデータ処理やデータセンター全体でのデータ移動などのストレージおよびネットワーク機能を引き継ぐために使用されます。
IoTの爆発的な増加と5G接続の利用可能性により、データセンターを通過するデータの量が増加し、数百万の新しいデータ生成デバイスがオンラインになるにつれて、DPUはデータセンターサーバーによって実行されるストレージおよびネットワーク機能を加速するために必要になります。では、DPUとは具体的に何でしょうか?この質問には、以下で詳しく答えます。
DPUとは?
データ処理ユニットとも呼ばれるDPUは、マルチコアプロセッサ(通常はArmプロセッサ)、非常に高速なデータ転送が可能なネットワークインターフェイスコントローラ(100ギガビット/秒から200ギガビット/秒)、アプリケーションのパフォーマンスを加速する一連のアクセラレーションエンジン、およびRAMメモリから構成されています。また、Nvidiaは、機械学習やディープラーニングを含むAIアプリケーションを実行するために使用されるAmpere GPUを搭載したDPUを提供しています。さらに、AIを使用して異常なトラフィックの特定を含むリアルタイムのセキュリティ分析を行うことができ、組織が機密データの盗難やネットワーク上の悪意のある活動を特定するのに役立ちます。そうは言っても、DPUのコア機能は、分離、ルートトラスト、キー管理、エラスティックブロックストレージ、データ圧縮などを含むネットワークおよびストレージタスクを引き継ぐ能力に変わりはありません。

たとえば、Nvidia Mellanox BlueField 2は、業界をリードするConnectXネットワークアダプタといくつかのARMコアを組み合わせることで作られたデータ処理ユニットであり、データセンターに高度なネットワーク、ストレージ、セキュリティ機能を提供します。さらに、BlueField 2 DPUは、最大200ギガビット/秒の速度でデータを転送しながら、データセンターサーバーのコアを解放して、収益を生み出すサービスのパフォーマンスを向上させることができます。
全体として、DPUの未来は非常に明るいと言えます。これは、生成されるデータの量が増え続けるにつれて、データセンターが既存のサーバーからより多くのパフォーマンスを引き出す方法を探しているためです。サーバーにDPUを装備すると、ネットワークとストレージの機能をCPUからDPUにオフロードし、DPUがデータセンター全体でのデータの移動を管理できるようになるため、サーバーのパフォーマンスを30%以上向上させることができます。これは、データセンターのオペレータにとって非常に重要です。なぜなら、すべての機器を交換することなく、既存のハードウェアからより多くのパフォーマンスを引き出すことができるからです。
データ処理ユニットの主要コンポーネントとは?
データ処理ユニットは、以下のコンポーネントを持つSoC(システムオンチップ)の一種です。高性能ネットワークインターフェイスコントローラ、マルチコアプロセッサ(NvidiaはArmプロセッサを使用)で、ソフトウェアでプログラミング可能、ランダムアクセスメモリ(最大16GBのRAM)、および豊富なプログラマブルパフォーマンスアクセラレータです。高性能ネットワークインターフェイスコントローラは、データセンター全体でのデータの処理、解析、転送を担当します。
DPUに搭載されている一般的な機能:
- オンボードの100ギガビット/秒から200ギガビット/秒のインターフェイスによる超高速接続
- 高速パケット処理
- マルチコア強力CPU
- DDR4またはDDR5 RAMのサポート
- パフォーマンスアクセラレータ
- PCI Express 4.0のサポート
- セキュリティ機能
- データおよびストレージ管理機能
なぜDPUサーバーはより人気を集めているのでしょうか?
DPUサーバーは、前述のとおり、通常のデータセンターサーバーよりも強力であるため、人気が高まっています。これは、DPUアクセラレーションサーバーが、すべてのネットワークおよびストレージ機能をDPUにオフロードし、エンタープライズアプリケーションの実行に使用できるサーバー内の処理能力を解放できるためです。データセンターに到着するデータが増えるにつれて、処理能力の向上は重要性を増し続けています。データセンターサーバーは、受信するデータを処理および分析するための十分な処理能力が必要です。これを行う1つの方法は、ネットワークおよびストレージ機能をDPUにオフロードすることです。DPUは、データセンター全体でデータを東西に移動するために特に最適化されています。
ムーアの法則が減速したため、データ増加に対処するためにCPUパフォーマンスを向上させることは不可能であり、データフローと処理を管理するためにDPUのような専用ハードウェアが必要とされています。実際、Intel、Google、およびMicrosoftは、データ爆発に対処するための可能な解決策としてデータ処理ユニットに注目しています。
したがって、データ量と速度が増加するにつれて、DPUサーバーは、暗号化や保護などのデータ関連のワークロードを処理し、CPUからDPUにオフロードできるため、人気が高まっています。これにより、CPUはオペレーティングシステム(OS)とエンタープライズアプリケーションの実行に集中でき、サーバーの全体的なパフォーマンスを向上させるとともに、ストレージとネットワークの改善も実現します。
DPUサーバーの一般的な構成とは?
サーバーの異なる構成をいくつか見てみましょう。これらの項目はすべて、データ処理ユニットに加えてサーバーに追加できます。
1. 計算能力
高性能サーバーには、デュアルインテル Xeon SP(スケーラブル・プロセッサー)を搭載でき、それぞれ最大28コアと56スレッドを備えています。Xeonプロセッサーは、非常に高速な性能を提供し、データセンターに課せられる増大する要求、すなわち高速なデータストレージとアクセスを提供するための組織を支援します。さらに、高コア数のプロセッサーは、新しいサービスを可能にし、企業、テクニカルコンピューティング、ストレージ、およびクラウドで新しいアプリケーションを提供します。さらに、インテル Xeonプロセッサーは、性能、電力効率、セキュリティ、および仮想化に関して大きな利点を提供します。また、サーバーはデュアルAMD Epycプロセッサーを使用して構成することもでき、それぞれ64コアと128スレッドを備え、合計128コアと256スレッドの超高速処理能力を提供します。さらに、もしあなたのワークロードがそれほど多くの処理能力を必要としない場合、シングルAMD Epycプロセッサーで構成できるサーバーもご用意しています。
2. 高性能ストレージ
Premioのサーバーは、NVMeストレージを含む高性能ストレージを搭載でき、高いストレージスループット性能とアプリケーション応答性を提供します。NVMeストレージを搭載したサーバーは、SATAやSASインターコネクトを使用しているレガシーソリューションよりもはるかに高速です。NVMe SSDは、サーバーのPCIeバスに直接接続され、SATAコントローラーに接続するSSDと比較して、性能を大幅に向上させ、レイテンシを著しく低減します。保存およびアクセスされるデータ量が増加し続けるにつれて、より高速な処理と、より大容量の高速データストレージの必要性が高まっています。
3. 高速ネットワーク接続
高性能DPUサーバーは、オンボードおよびDPU自体に配置されたイーサネットLANポートを介して大量の接続性を持っています。マザーボード自体には、2つのギガビットイーサネットポートと1つの管理ポートが付属しています。ただし、利用可能な接続の量は、データ処理ユニットと通常のNICをシステムにいくつ構成するかによって異なります。現在利用可能な最も一般的なDPUのいくつかにおけるパフォーマンス仕様を以下に示します。
- Xilinx Alveo U25 – 2x 25ギガビットイーサネットポート
- Xilinx Alveo U50 – 1x 100ギガビットイーサネットポート
- Xilinx Alveo U200 – 2x 100ギガビットイーサネットポート
- Xilinx Alveo U250 – 2x 100ギガビットイーサネットポート
- Xilinx Alveo U280 – 2x 100ギガビットイーサネットポート
- Nvidia Mellanox BlueField 2 – 10/25/50/100ギガビットのデュアルポート、または200ギガビットのシングルポート
- Silicom FPGA SmartNIC N5010 Series – 4x 100ギガビットイーサネットポート
注:10/25ギガビット接続用のSFP28または100/200ギガビット接続オプション用のQFSP28のいずれかをサポートしています。
バランスの取れたPCIeアーキテクチャ
DPUサーバーは、ストレージとネットワーク帯域幅のバランスを取るスループット最適化構成を採用しています。したがって、接続されたストレージドライブがネットワークよりも高速であっても、両端から処理されるデータ量は同等であり、ストレージとネットワークI/Oが一致するバランスの取れた設計を組織に提供します。さらに、バランスの取れたPCIeアーキテクチャは、高いデータ並列性を持ち、CPUとDPUの両方を使用してワークロードを処理するコードに対してバランスの取れたパフォーマンスを提供し、サーバーが最適なパフォーマンスを発揮することを保証します。
CPU、GPU、DPUの違いは何ですか?
CPUは、広範囲のタスクを可能な限り迅速に実行するように設計および構築されており、非常に多用途です。CPUは、タスクを達成するために必要な関連するトランジスタを切り替えるようにCPUを指示する、大規模で広範な命令セットを持っています。一方、GPUはそのような広範な命令セットを持っていませんが、一部のアプリケーションにおいてはCPUよりも利点があります。GPUはCPUよりもはるかに多くのコアを持っています。たとえば、一般的なCPUプロセッサは4〜10コアを持ち、一部のサーバーCPUは最大64コアを持つ一方、一般的なGPUは何百または何千もの小型コアを持つことができます。たとえば、RTX 3080は8700以上のコアを持っています。したがって、CPUはGPUよりもインテリジェントですが、GPUコアの膨大な数と提供される並列性により、多くの数学的計算を必要とするアプリケーションを実行するのに最適な選択肢となります。

当初、GPU(グラフィック処理ユニット)は豊かでリアルタイムのグラフィックを提供するために使用されていましたが、観察者たちはGPUが特定のアプリケーションを加速できることを発見しました。GPUから大きな恩恵を受けるアプリケーションには、機械学習、深層学習、リスクモデリング、金融シミュレーション、その他多くの科学計算が含まれます。GPUが人工知能ワークロードを加速できるのと同様に、DPUはネットワークおよびストレージ機能をCPUからDPUにオフロードして実行することにより、それらを加速することができます。DPUは、データセンター内のデータの移動を管理するのに優れています。
最も一般的なDPUソリューションは何ですか?
Nvidiaは、Nvidia Mellanox BlueField 2データ処理ユニット(DPU)というDPUをリリースしました。さらに、NvidiaはMellanox BlueField 2X DPUもリリースしており、これはBlueField 2 DPUと同じ機能を持ち、Ampere GPUが追加されています。Ampere GPUは、セキュリティ異常検出などの人工知能アプリケーションを実行し、ネットワーク侵害を検出して防止するために使用できます。これだけでは十分でない場合、Nvidiaはすでに2022年のBlueField 3と2023年のBlueField 4を含む2つの新しいDPUのリリースを計画しています。
さらに、IntelとXilinxは独自のDPUを市場に投入しましたが、データ処理ユニットをSmartNICと呼んでいます。XilinxとIntelの両方のソリューションは、FPGAとネットワークインターフェイスコントローラを組み合わせて、DPUと同様にネットワークとストレージ機能を加速します。
たとえば、IntelはSilicomと提携し、Intel Stratix 10 FPGAとIntel Ethernet 800シリーズアダプタを組み合わせたSilicom FPGA SmartNIC N5010を提供しています。これは、4x 100ギガビットイーサネットポートの搭載により、十分な帯域幅を提供します。そうは言っても、Xilinxは、データセンターのパフォーマンスレベルを向上させるために、ネットワーク、ストレージ、およびコンピューティング機能をXilinx SmartNICにオフロードするALVEOシリーズのSmartNICを提供しています。Xilinx Alveo U25はFPGAプラットフォームに基づいており、不要なデータ移動とCPU処理を避けながら、超高スループットと低遅延を提供します。
データセンターサーバーで使用されるその他のパフォーマンスアクセラレータは何ですか?
1. GPU(グラフィック処理ユニット)

出典(Nvidia)
データセンターで一般的に見られるその他のパフォーマンスアクセラレータには、GPU(グラフィック処理ユニット)、コンピュテーショナルストレージデバイス(CSD)、およびFPGA(フィールドプログラマブルゲートアレイ)があります。GPU(グラフィック処理ユニット)は、複雑な数学的ワークロードを加速するためにデータセンターサーバーでよく使用されます。GPUは、数千個の小さなコアを搭載しているため、数学的ワークロードの実行に優れており、多くのタスクと計算を並行して実行できます。そのため、グラフィック処理ユニットは、人工知能、ディープラーニング、機械学習、高解像度ビデオ編集、医療画像処理、その他多くの要求の厳しいワークロードに最適です。
2. コンピュテーショナルストレージデバイス(CSD)

出典(Anandtech)
コンピュテーショナルストレージは、データセンターにおいてパフォーマンスアクセラレーターとして使用されます。コンピュテーショナルストレージは、ストレージデバイスレベルでデータを処理できるようにすることでサーバーのパフォーマンスを加速させ、入出力のボトルネックを削減しながら、可能な限り低いレイテンシーでリアルタイムデータ分析を実行する能力を組織に提供します。コンピュテーショナルストレージデバイスは、通常のストレージデバイスと似ていますが、ストレージデバイス自体でデータを処理および分析するマルチコアプロセッサを搭載しており、組織はストレージデバイスレベルで価値ある実用的な洞察を抽出できます。さらに、サーバーにコンピュテーショナルストレージデバイスを搭載すると、データがストレージデバイス自体でほぼリアルタイムに処理および分析されるため、レイテンシーが削減されます。さらに、データを取り外す必要がなく、ストレージデバイス上に残るため、脆弱性を軽減することでセキュリティが向上します。
3. フィールド・プログラマブル・ゲート・アレイ(FPGA)

出典 (Xilinx)
FPGAは、論理ブロック、I/Oセル、およびその他のリソースから構成される集積回路であり、ユーザーが特定の要件に応じて異なる配置でチップを再プログラムおよび再構成することを可能にします。FPGAは、機械学習および深層学習のワークロードを実行するために広く利用されています。さらに、FPGAは、その高性能、高帯域幅、高スループットのおかげで、SmartNICsで使用され、可能な大規模な並列処理により、ネットワーク機能を桁違いに高速化しています。全体として、FPGA SmartNICはDPUに似ており、サーバーのCPUからネットワークおよびストレージ機能をオフロードし、専用のハードウェアでそれらを実行できるため、貴重なCPU処理能力を解放します。
まとめ
データセンターへのデータ流入が増加し続ける中、データセンターがシステムのパフォーマンスを最大化してこのデータ流入に対応する必要があるため、この時点でDPU(データ処理ユニット)がデータセンターで一般的になることは驚くべきことではないでしょう。DPUを使用すると、データセンターのオペレーターは、ホストシステムからデータ処理ユニットにストレージおよびネットワーク機能をオフロードすることで、サーバーのパフォーマンスをより引き出すことができます。Nvidiaは、1つのBlue Field 2 DPUが、そうでなければ125個のCPUコアを必要とする同じデータセンターサービスを処理できると主張しています。Premioは、30年以上にわたり米国でコンピューターを製造しており、お客様の特定の要件に合わせてカスタマイズできるさまざまな高性能DPUサーバーを提供しています。DPUサーバーの選択またはソリューションのカスタマイズについてサポートが必要な場合は、お問い合わせください。当社のサーバー専門家が、お客様の特定の要件を満たすソリューションを見つけるお手伝いをいたします。
次のDPUアクセラレーテッドサーバーを探索
Premioは様々な高性能DPUサーバーを提供しており、そのうちの1つがFlache Streams DPUサーバーです。このサーバーは、最大18個のデータ処理ユニット(DPU)、高速NVMe SSDストレージ、デュアルIntel Xeonプロセッサ、デュアルAMD Epycプロセッサ、またはシングルAMD Epycプロセッサを搭載できます。さらに、サーバーは高速NVMe SSDとSATA経由の通常のSSDストレージで構成できます。データ処理ユニットは、サーバーのメインCPUからネットワーキング、ストレージ、およびセキュリティ機能の一部をDPUにオフロードし、貴重な処理能力を解放して収益を生むエンタープライズアプリケーションを実行するために追加されます。たとえば、当社のDPUサーバーの1つを、複数のMellanox BlueField 2 DPU、PCIe NVMeストレージ、およびデュアルIntel Xeon SP(スケーラブルプロセッサ)で構成でき、十分なCPU処理能力、高速ソリッドステートストレージ、およびデータ処理ユニットの組み込みにより、大量のネットワーク機能を提供します。
