深層学習とADAS
エッジにおけるリアルタイムな意思決定が自律走行システム開発を促進
自動車産業はこれまで以上にビッグデータを活用しています。さまざまなセンサーやその他の機器がADAS(先進運転支援システム)の5つのレベルを進化させるにつれて、自動運転車はナビゲートし、障害物を避け、道路標識の指示に従う能力が向上しています。AIは、これらの改善を確実に推進しています。エッジに展開された深層学習トレーニングと深層学習推論モデルは、継続的な革新と完璧な自律走行性能に不可欠です。しかし、このレベルのインテリジェンスを最大限に活用するには、専用のハードウェアが必要です。高速ソリッドステートデータストレージ、GPUとCPUによる処理、堅牢な接続性、ハードウェアベースのセキュリティなどを満載した強化システムは、大量のデータを最適化するために必要なパフォーマンスを提供します。
ソフトウェアベースの深層学習機能と堅牢なハードウェアは連携して、リアルタイムデータを集約、保存、適用します。しかし、深層学習トレーニングと深層学習推論とは何でしょうか。そして、絶え間なく押し寄せる新しい洗練されたデータを処理できるのは、どのような種類のシステムでしょうか。弊社のAutonomous Vehicle Engineeringに掲載された記事では、深層学習トレーニングと推論の違いと関係性、そしてこれらの技術がよりスマートで安全な自律走行車にどのように最適に適用されるかを説明しています。
概要
自動車の「ビッグデータ」が到来しました。自動運転車やADAS統合車両によって生成されるデータの膨大な範囲は、SAEの5段階の自動運転レベルに及び、高解像度カメラ、レーダー、ライダー、超音波センサー、GPS、および車両が周囲を視認または認識するためのその他のセンサーに依存しています。最終的に、この大量の感覚情報は、安全運転に必要なナビゲート、障害物回避、道路標識の読み取りに使用されます。
人工知能(AI)は、これらのオペレーションの中核をなしており、ソフトウェアアルゴリズムに基づいて、完璧な性能に不可欠な深層学習トレーニングと深層学習推論モデルによって駆動されます。これらの重要かつ瞬間的なプロセスを可能にするには、AIアルゴリズムをトレーニングし、車両に展開する必要があります。これは、開発者が高度なソフトウェア設計とスマートなハードウェア戦略の両方を活用して、生死にかかわる可能性のある車両性能を保護するプロセスです。深層学習トレーニングと深層学習推論は互換性のある用語のように聞こえるかもしれませんが、それぞれがドライバーを安全に保ち、ますますインテリジェントな自動車機能でOEMを区別するシステムにおいて、非常に異なる役割を担っています。深層学習トレーニングは、データセットを使用して深層ニューラルネットワークに画像認識や音声認識などのAIタスクを完了するように教えます。深層学習推論は、同じネットワークに新しいデータまたは未知のデータを供給し、そのトレーニングに基づいてそのデータが何を意味するかを予測するプロセスです。これらのデータ集約型計算操作には、専用のソリューションが必要です。システムには、大量の高速ソリッドステートデータストレージが必要です。また、常に移動し、激しい衝撃や振動、その他の過酷な環境要因にさらされる車両に展開するために、堅牢性も備えている必要があります。理想的な設計では、深層学習のソフトウェアベースの機能と、エッジおよびクラウド処理の両方に最適化された堅牢なハードウェア戦略を組み合わせます。
深層学習トレーニングとは
AIを作成する最も困難で時間のかかる方法ではありますが、深層学習トレーニングは、深層ニューラルネットワーク(DNN)にタスクを実行する能力を与えます。相互接続された人工ニューロンの多くの層で構成されるDNNは、音声からテキストへの翻訳、画像分類、ビデオカタログ作成、または推奨システムの生成などの特定のAIタスクを実行するように学習する必要があります。これは、DNNにデータを供給することで達成され、DNNはそれを使用してデータが何を意味するかを予測します。たとえば、DNNは犬、車、自転車の3つの異なるオブジェクトを区別する方法を教えられるかもしれません。最初のステップでは、犬、車、自転車を含む数千枚の画像で構成されるデータセットをまとめます。2番目のステップでは、画像をDNNに供給し、画像が何を表しているかを判断できるようにします。不正確な予測が行われた場合、人工ニューロンが修正され、エラーが修正されるため、将来の推論がより正確になります。このプロセスでは、ネットワークは提示されるたびに画像の真の性質をより正確に予測する可能性が高くなります。トレーニングプロセスは、DNNの予測が希望の精度レベルに達するまで続きます。

この時点で、トレーニングされたモデルは、新しい画像を使用して予測を行う準備が十分に整っています。深層学習トレーニングは、DNNのトレーニングに何十億もの計算がしばしば必要となるため、非常に計算集約的になる可能性があります。この方法は、計算を高速に実行するための強力な計算能力に依存します。データセンターで実行される深層ニューラルネットワークのトレーニングは、マルチコアプロセッサ、GPU、VPU、およびその他のパフォーマンスアクセラレータを活用して、AIワークロードを非常に高速かつ正確に前進させます。
深層学習推論
深層学習トレーニングの拡張である深層学習推論は、完全にトレーニングされたDNNを使用して、生成された場所により近い、新しい、これまで見たことのないデータに基づいて予測を行います。画像などの新しいデータをネットワークに供給することにより、深層学習推論は画像のDNN分類を可能にします。たとえば、「犬、車、自転車」の例に追加すると、これらおよびその他のオブジェクトの新しい画像をDNNにロードして画像分類を可能にできます。完全にトレーニングされたDNNは、画像の識別を正確に予測できるようになりました。DNNが完全にトレーニングされると、他のデバイスにコピーできます。DNNは非常に大きく、何百もの層の人工ニューロンと何十億もの重みを含んでいる場合があります。展開する前に、ネットワークはより少ない計算能力、エネルギー、メモリを必要とするように変更する必要があります。その結果、わずかに精度が低下したモデルになりますが、これは簡素化によるメリットによって相殺されます。
DNNを変更するには、プルーニングまたは量子化の2つの方法があります。プルーニングでは、データサイエンティストがDNNにデータを供給し、観察します。発火しない、またはめったに発火しないニューロンが特定され、予測精度を大幅に低下させることなく削除されます。量子化には、重みの精度を低下させることが含まれます。たとえば、32ビット浮動小数点数を8ビット浮動小数点数に減らすと、より少ない計算リソースを消費する小さなモデルが作成されます。どちらの方法も、モデルの精度にほとんど影響を与えません。同時に、モデルははるかに小さく高速になり、その結果、エネルギー使用量が少なくなり、計算リソースの消費が少なくなります。
ADASにおけるエッジの活用
「エッジ」での深層学習推論は、一般的にハイブリッドモデルを使用してきました。このモデルでは、エッジコンピューターがセンサーまたはカメラから情報を収集し、その情報をクラウドに送信します。しかし、データがクラウドに配信され、分析され、返されるまでに数秒を要することが多いため、リアルタイム推論分析または検出を必要とするアプリケーションにとっては許容できない遅延が発生します。時速60マイル(96km/h)で走行するAVは、わずか数秒で100フィート(30m)以上を誘導なしで移動してしまう可能性があります。対照的に、専用のエッジコンピューティングデバイスは、瞬時の自律意思決定のためにリアルタイムで推論分析を実行します。これらの産業用グレードのAI推論コンピューターは、車載での過酷な展開に耐えるように設計されています。車両のバッテリーからの給電など、さまざまな電源入力シナリオに対応し、衝撃、振動、極端な温度、ほこり、その他の環境上の課題への暴露に耐えられるよう堅牢化されています。

構成可能な処理能力を備えたエッジ推論コンピューターは、エッジで機械学習と深層学習推論分析を実行できます。マルチコアプロセッサ、GPU、VPU、TPU、FPGA、NVMe計算ストレージデバイスなどのパフォーマンスアクセラレータは、特に最新のコンピュータアーキテクチャ設計において機能を向上させます。豊富なI/Oを備えた自動運転車データレコーダーは、十分なUSB Type-Aポート(Gen 3.2 10Gbps)、RJ45およびM12ギガビットイーサネットポート、RJ45およびM12 PoE+ポート、シリアルCOMポートなどを備えており、カメラとセンサーをデータコンピューターに接続できます。
これらの特性により、クラウドを介した深層学習推論アルゴリズムの処理に関連する多くの問題が解消され、独自の高いパフォーマンスと相まって解決されます。たとえば、GPUとTPUは、無数の線形代数計算を実行する能力を加速させ、システムがそのような操作を並列化できるようにします。CPUがAI推論計算を実行するのではなく、GPUまたはTPU(数学計算の実行に優れている)がワークロードを処理し、推論分析を大幅に加速させながら、CPUは残りのアプリケーションとオペレーティングシステムの実行に集中します。ローカル推論処理は、遅延問題を解消し、特に大規模なビデオフィードの生データ伝送に関連するインターネット帯域幅の問題を解決します。ギガビットイーサネット、10ギガビットイーサネット、Wi-Fi 6、セルラー4G LTEなどの複数の有線および無線接続技術により、システムはさまざまな状況でインターネット接続を維持できます。出現しつつある5G無線接続は、大幅に高速なデータレート、はるかに低い遅延、および改善された帯域幅により、さらにオプションを拡大します。これらの豊富な接続オプションにより、ミッションクリティカルなデータをクラウドにオフロードし、OTA(Over-The-Air)アップデートに対応できます。さらに、CANBusサポートにより、車両バスおよびネットワークから車両データをログに記録するソリューションが強化されます。車両速度、ホイール速度、エンジン回転数、ステアリング角度、その他の豊富なデータは、リアルタイムの洞察と車両に関する重要な情報のために評価できます。
ビッグデータ、大きな機会
自動運転機能の増え続けるリストを市場に投入するために、ADAS開発者は機能とパフォーマンスに影響を与えるアルゴリズムの改善に注力してきました。しかし、専門のハードウェアが必要です。AIエッジ推論コンピューターは、このプロセス用に開発された強化されたコンピューティングソリューションであり、ほこり、破片、衝撃、振動、極端な温度への暴露に耐えるように構築され、複数のソースから膨大な量のデータを収集、処理、保存するように設計されています。データを収集することは、ADASを推進するための最初のステップにすぎません。よりスマートで安全な、より高度に自動化された車両のためには、ソフトウェア開発と特殊なハードウェア戦略が連携する必要があります。
