NVIDIA Blackwell GPUアーキテクチャの最新情報とは?

NVIDIAのBlackwellアーキテクチャの導入と、以前のAda世代からの緩やかな移行により、産業用AI展開は新たな段階に入っています。製造、オートメーション、スマートインフラストラクチャ、さらにフィジカルAIやエージェントAIといった新興分野において、各組織は次世代エッジワークロードを強化するためにNVIDIA Blackwell GPUの導入を加速させています。

これらのアプリケーションは、特にリアルタイム処理とシステム信頼性が重要な環境において、より高いレベルのコンピューティング性能、効率、スケーラビリティを要求します。

このブログでは、Blackwellが以前のAdaアーキテクチャとどのように比較されるかを探り、主要な進歩と新機能に焦点を当てます。

 

エッジおよびワークステーション展開向けのNVIDIA Blackwell GPU

アーキテクチャの更新に入る前に、GPUのラインナップそのものを理解することが重要です。NVIDIAのBlackwellアーキテクチャは、データセンター、ワークステーション、エッジコンピューティングのユースケースをカバーする複数のGPUティアにまたがっています。産業用エッジPCの展開において最も関連性の高いモデルは、性能、電力効率、コンパクトなフォームファクタのバランスが取れたプロフェッショナルRTX PROシリーズです。 

エッジAIシステム向けワークステーションGPU:

  • NVIDIA RTX PRO 6000 Blackwell Workstation Edition
  • NVIDIA RTX PRO 6000 Blackwell Max-Q Workstation Edition
  • NVIDIA RTX PRO 5000 Blackwell
  • NVIDIA RTX PRO 4500 Blackwell
  • NVIDIA RTX PRO 4000 Blackwell
  • NVIDIA RTX PRO 4000 Blackwell SFF Edition
  • NVIDIA RTX PRO 2000 Blackwell

これらのGPUは以下の用途に最適化されています。

  • 推論、シミュレーション、生成AIを含むAIおよびデータ集約型ワークロード
  • エントリーレベルからハイエンドワークステーションコンピューティングまでのスケーラブルなパフォーマンスティア
  • 大規模なデータセットとモデルを処理するための高いメモリ容量と帯域幅
  • AI、視覚化、分析を組み合わせたマルチアプリケーションワークフロー
  • フルサイズワークステーションからコンパクトでスペースに制約のあるシステムまで対応する柔軟な展開

 

NVIDIA Blackwellアーキテクチャの主な進歩

以前のAdaアーキテクチャと比較して、BlackwellはAIコンピューティング性能コアアーキテクチャデータスループットにおいて測定可能な改善を導入し、現代のエッジワークロードのより効率的な実行を可能にします。

高密度コンピューティング:CUDAコアとAI性能

Blackwellにおける最も注目すべき進歩の1つは、CUDAコア数の増加とAIアクセラレーションの向上による、生のコンピューティング能力の向上です。

GPUモデル

 CUDAコア (Ada)

CUDAコア (Blackwell)

AI TOPS (Ada)

AI TOPS (Blackwell)

TDP
RTX 6000 18,176 24,064 ~1,457 ~3,511 300W
RTX 5000 12,800 14,080 ~1,044 ~2,064 250W/300W
RTX 4500 7,680 10,496 ~634 ~1,687 210W/200W
RTX 4000 6,144 8,960 ~428 ~1,247 130W/140W
RTX 4000 SFF 6,144 8,960 ~307 ~770 70W
RTX 2000 2,816 4,352 ~192 ~545 70W

これは、前世代のGPUと比較してAIスループットが大幅に向上したことを意味し、以下を可能にします。

  • AIおよびシミュレーションワークロードのより高い並列処理
  • マルチモデルパイプライン全体でのより高速な推論
  • より複雑で大規模なAIアプリケーションのサポート

Blackwellは、ピーククロック速度のみに焦点を当てるのではなく、同じ電力エンベロープ内でより高いパフォーマンスを提供することで、コンピューティング密度を向上させ、結果として大幅に高いワットあたりのパフォーマンスを実現します。 

 

第5世代Tensorコアによる高度なAIコンピューティング

Blackwell GPUは、FP4精度をサポートする第5世代Tensorコアを導入し、より高速で効率的なAI処理を可能にします。NVIDIAによると、これらのコアは前世代と比較してAIワークロードで最大3倍の性能向上を実現します。

これにより、エッジシステムは以下のようなより複雑なワークロードを処理できるようになります。 

  • コンピュータービジョンと検査
  • 予測分析
  • ローカルLLM推論と生成AI

(画像出典: NVIDIA)


GDDR7搭載の次世代メモリ

Blackwellのもう1つの大きな進歩は、GDDR7メモリへの移行です。これにより、メモリ帯域幅と全体的なワークロード容量の両方が向上します。ワークステーションのラインナップ全体で、Blackwell GPUは最大96GBのGPUメモリを搭載し、システムがより大規模なAIモデル、より複雑なシミュレーション、およびより重いマルチアプリケーションワークロードを処理できるようにします。この追加されたメモリヘッドルームは、データセットのサイズとスループットがパフォーマンスに直接影響する高性能AIおよびビジュアルコンピューティング環境で特に価値があります。 

(画像出典: NVIDIA)


AI管理プロセッサとワークロード統合

Blackwellは、GPUワークロードのスケジューリングと実行方法を改善するために設計されたAI管理プロセッサ(AMP)と呼ばれる新しいアーキテクチャコンポーネントを導入しています。

AMPは、GPU上で直接タスクスケジューリングを管理する専用のオンダイプロセッサであり、CPUへの依存を減らします。これにより、同時ワークロード間のより効率的な連携が可能になり、複数のアプリケーションが同時に実行されている場合のレイテンシが低減されます。

同時に、BlackwellはAIをGPUアーキテクチャ全体により緊密に統合し、レンダリング、シミュレーション、ビデオ処理ワークロードと並行して動作できるようにします。AIを独立した機能として扱うのではなく、GPUは単一のプラットフォームで混合ワークロードをより効率的に処理できるようになりました。

実用的な観点から見ると、これによりシステムはAI推論視覚化シミュレーションビデオ処理を同時に実行でき、特に電力とスペースが制約されるエッジ展開において、全体的な利用率を向上させ、システムの複雑さを軽減します。

(画像出典: NVIDIA)

 

NVIDIA Blackwell GPUで何ができるようになったか?

これらのアーキテクチャの進歩により、Blackwell GPUは、単一システムで新しい種類のワークロードを効率的に実行できるようになります。複数の特殊なアクセラレータに依存する代わりに、組織はコンピューティングを統一されたプラットフォームに統合できるようになりました。

現在では、実際に以下のワークロードを実行できます。

  • リアルタイム意思決定のためのAI推論
  • 3DレンダリングおよびHMIアプリケーションのための視覚化
  • モデリングおよびデジタルツイン環境のためのシミュレーション
  • 分析およびマルチストリームワークロードのためのビデオ処理

単一のGPU上で、これらのワークロードをエッジで直接展開できるため、システムの複雑さが軽減され、全体的な効率が向上します。

この機能は、以下のようなアプリケーションで特に重要です。 

  • シミュレーションとリアルタイムデータが連携して動作する必要があるデジタルツイン
  • 低レイテンシAIとビジョン処理を必要とするロボティクス
  • 検査、分析、自動化が継続的に実行されるスマート製造

これらのワークロードを統合することで、Blackwellはよりスケーラブルで効率的なエッジシステムを可能にし、組織は高性能を維持しながらデータソースの近くでデータを処理できるようになります。 

 

Premioの産業用GPUコンピューターはNVIDIA Blackwellに対応

Blackwell GPUを最大限に活用するには、システムアーキテクチャ自体がGPUと同じくらい重要です。Premioの産業用GPUコンピューターは、高性能NVIDIA GPUをサポートしながら、エッジ展開の信頼性と環境要件を満たすように設計されています。

Premioは、さまざまな展開要件に最適化されたGPU対応プラットフォームを幅広く提供しています。詳細については、Premioの産業用GPUコンピューターページをご覧ください。

すべてのPremio GPUシステムは、動作中のGPUを固定するためのロックブラケットなどのGPU保持メカニズムを含む、産業グレードの耐久性で設計されています。これにより、衝撃、振動、その他の過酷な条件下でも信頼性の高いパフォーマンスが保証されます。 

 

結論

NVIDIA Blackwellは、より効率的なAIネイティブGPUアーキテクチャへの転換を示しており、ワットあたりの性能向上、メモリ機能の改善、複数のワークロードを単一プラットフォームに統合する機能を提供します。以前のAda世代と比較して、Blackwellは現代のAIの要求により最適化されており、推論、シミュレーション、視覚化、ビデオ処理などのワークロードを、制約のある環境でもより効率的に同時に実行できるようにします。産業用エッジ展開にとって、これはより高速なリアルタイム処理、システムの複雑さの軽減、そしてより高いスケーラビリティにつながります。Premioの産業用GPUコンピューターと組み合わせることで、これらの機能は過酷でスペースと電力の制限がある環境でも確実に展開でき、製造、ロボティクス、スマートインフラストラクチャにおける次世代エッジAIアプリケーションのための堅牢な基盤を提供します。