オンプレミスLLMエッジサーバーによるリアルタイムの生産トラブルシューティングの加速

メーカーがインダストリー4.0テクノロジーの導入を進めるにつれて、機密性の高い運用情報はオンサイトに保持しつつ、より多くのデータ処理を工場現場に近づけるようになっています。ある製造環境では、オペレーターがPLCアラーム、検査カメラの結果、保守記録をシンプルなローカルインターフェースを通じてレビューし、技術者がクラウド接続に頼ることなく機械の状態と保守履歴を迅速に確認できる方法が必要でした。この要件をサポートするため、PremioのオンプレミスLLMワークロード用1UエッジAIサーバーLLM-1U-RPLが導入され、チームが生産上の問題をより迅速に特定し、シフトをまたいでより一貫したトラブルシューティングを維持できるよう、ローカライズされた処理を提供しました。 

 

課題

  • オペレーターが機密情報をクラウドに送信することなく、運用データとエンジニアリングドキュメントを確認できるよう、LLM推論をローカルで実行する必要がある
  • 既存の工場現場システムは、リアルタイム分析のためのGPU高速ワークロードをサポートするように設計されていなかった
  • 複数の工場システムからの運用データを単一のトラブルシューティングインターフェースにまとめることが困難であった
  • 制御盤内の限られたラックスペースでは、コンパクトで奥行きの短いラックマウントソリューションが必要とされた
  • 継続的な生産環境では、安全で信頼性の高い24時間365日の運用が可能なハードウェアが必要とされた 

ソリューション 

  • Premioの1U エッジAIサーバー(オンプレミスLLMワークロード用)LLM-1U-RPL
  • PCIe Gen 4拡張機能は、LLM処理を高速化するためのNVIDIA RTX PRO 4500 Blackwell GPUの統合をサポート
  • 既存の工場システムとの統合をサポートするUSBおよびCOMインターフェースを備えた複数の2.5GbE LANポート
  • 制御室や工場インフラに適したコンパクトなラックマウントフォームファクター
  • ホットスワップ可能なファンとTPM 2.0を備えた冗長600W電源は、安全な24時間365日運用をサポート 

利点 

  • Intel組み込みプロセッサによる10年間のライフサイクルサポート
  • 4〜5週間での迅速な導入
  • Premioのロサンゼルスを拠点とするサポートチームが支援するNDAAおよびTAA準拠ソリューション 

 

会社概要 

同社は、検査システムが製品の品質を継続的にチェックし、オペレーターが問題を迅速に検出する自動生産ラインを運営しています。工場全体で機械データと技術文書が増えるにつれて、オペレーターは、稼働中のシフト中に問題に対応しながら、この情報をより迅速に確認する方法を必要としていました。Industry 4.0の取り組みの一環として、同社は、機密性の高い生産データをオンサイトに保持しつつ、トラブルシューティング情報にアクセスしやすくするために、ローカライズされたエッジコンピューティングを導入しました。 

 

課題 

ローカルLLM推論の必要性 

生産シフト中、オペレーターは機器の問題を診断しながら、機械データとエンジニアリングドキュメントを確認する必要が頻繁にありました。クラウド接続システムを介してこの情報にアクセスすると、応答時間が遅くなる可能性があり、機密性の高い運用データをオフサイトに保持することに対する懸念がありました。これに対処するため、チームはLLM推論をローカルで実行する方法を探し、トラブルシューティングガイダンスを工場環境内で直接利用できるようにしました。 

GPU高速ワークロードのための限られたインフラストラクチャ 

ほとんどの既存の工場現場システムは、AIワークロードの実行ではなく、制御と監視のために設計されていました。同じインフラストラクチャでLLMタスクを処理しようとすると、システムの応答性が低下し、リアルタイム分析をサポートする能力が制限されました。したがって、チームは、通常の操作に影響を与えることなくGPU高速処理を処理できる専用プラットフォームを必要としました 

システム全体で運用データにアクセスすることの難しさ 

機械情報、検査結果、保守記録は、複数の工場システムに分散されていました。問題が発生した場合、オペレーターは根本原因を特定する前に、複数の情報源をチェックする必要が頻繁にありました。これにより、トラブルシューティングが遅くなり、チーム間やシフト間で一貫性のない対応が生じました。 

制御盤内の設置スペースの制約 

制御室や機器盤内のラックスペースはすでに限られており、生産システム付近に標準深度のサーバーを設置することは困難でした。そのため、大型ハードウェアに対応するためにインフラを拡張すると、導入の複雑さが増し、既存のレイアウトが乱れる可能性がありました。そこでチームは、利用可能なスペースに収まり、現在のセットアップに容易に統合できるコンパクトなラックマウントプラットフォームを必要としていました。 

安全で信頼性の高い継続運用への要件 

生産システムは継続的に稼働しているため、新しいハードウェアはどれも、日常業務を中断することなく確実に運用できる必要がありました。また、エッジプラットフォームは、機密性の高い工場データを安全に保ちながら、長期にわたるワークロードを処理できる必要がありました。このため、チームは産業環境での安定した24時間365日の運用をサポートするように設計されたソリューションを探しました。 

 

ソリューション 


Premioの薄型1UエッジAIラックマウントサーバー(LLM-1U-RPL 

工場内でLLMワークロードを直接実行するための要件を検討した結果、チームはPremioのオンプレミスLLMワークロード向け1UエッジAIサーバー(LLM-1U-RPL)を導入の基盤として選択しました。薄型1U設計により、既存の制御室ラックに容易に設置でき、第13世代Intel Coreプロセッサと最大64GBのDDR4メモリのサポートにより、ローカライズされた推論タスクを処理するために必要なパフォーマンスが提供されました。GPUアクセラレーション、PCIe拡張、内蔵された信頼性およびセキュリティ機能への追加サポートにより、LLM-1U-RPLは、既存のインフラストラクチャを変更することなく、生産環境に自然に適合しました。 

GPUアクセラレーションLLM処理 

工場内でLLMワークロードを実行するには、既存の制御システムが提供できる以上の処理能力が必要でした。PCIe Gen 4拡張により、PremioのLLM-1U-RPLはNVIDIA RTX PRO 4500 BlackwellまでのワークステーションクラスGPUの統合をサポートし、チームは要件に応じてローカル推論を加速させることができました。これにより、外部のコンピューティングリソースに依存することなく、現地で運用データやエンジニアリングドキュメントを容易に確認できるようになりました。 

工場システムとの柔軟な接続 

この導入には、機械情報や検査データがすでに収集されている既存の工場システムへの信頼性の高いアクセスも必要でした。複数の2.5GbE LANポートとUSBおよびCOMインターフェースにより、追加のインターフェースハードウェアを必要とせず、これらの工場ネットワークと統合することができました。その結果、工場ネットワークのセットアップを変更することなく、サーバーを既存の環境に導入することができました。