ECCメモリとは?エンタープライズアプリケーションにおけるECC RAMの重要性

what-is-ECC-memory-the-importance-of-ECC-RAM-in-Enterprise-Applications

エンタープライズアプリケーションでは、多くの場合、24時間365日信頼性の高い運用が求められるミッションクリティカルな操作を伴います。そのため、企業はミッションクリティカルなアプリケーションが、破壊的な損害を引き起こす可能性のある故障なしに継続的に実行されることを保証するために、コンピュータメモリとしてECC RAMをインストールします。

ECCメモリとは?

ECCメモリ、またはエラー訂正コードメモリは、RAM(ランダムアクセスメモリ)の一種で、エラー訂正コードを利用してRAM上の潜在的なデータ破損を検出・修正します。一般的なメモリエラーしか検出できない非ECC RAMとは対照的に、ECC RAMはデータ破損やシステムクラッシュを引き起こす前にメモリエラーを即座に検出・修正できます。このため、ECCメモリは、特にミッションクリティカルなアプリケーション向けに、数多くのエンタープライズアプリケーションで利用されています。

RAMにおけるメモリデータ破損の原因は?

RAMのような揮発性フラッシュメモリの最小単位はセルと呼ばれます。メモリセルは、電子電荷を蓄積して1または0のいずれかを表すバイナリ情報1ビットを生成する電子回路です。複数のメモリセルの値はバイナリシーケンスに変換され、コンピュータ上でデータに変換されます。複数の1と0のビットからなる各シーケンスは、データに変換される独自の値を持ちます。例えば、バイナリシーケンス1001011は数値75を表します。

データ破損の問題は、これらのメモリセルのいずれかに不正確さがあり、8ビットのデータバイト内で状態が突然0から1に、またはその逆に変化する場合に発生します。メモリセル内のビットのこの誤った表現は、シングルビットエラーとして知られています。シングルビットエラーによるメモリフリップはコンピュータにとって無害であることもありますが、システムが誤ったコードを実行したり、システムシャットダウンを引き起こしたりする可能性のある破壊的なものでもあります。ここでは、シングルビットエラーの簡単な例と、それがどのように微妙または破壊的であるかを示します。

メモリの正しい情報がバイナリシーケンス1001011で数値75であると仮定しましょう。

1001011 (75) から 1001010 への単一メモリフリップは数値74を表し、これはまだ75にかなり近く、いくつかのアプリケーションにはかなり無害です。

しかし、1001011 (75) から 1101011 への単一メモリフリップは数値107を表し、これは75からかなり離れており、いくつかのアプリケーションには有害である可能性があります。

シングルビットエラーを引き起こすものは?

シングルビットメモリエラーには、ハードエラーとソフトエラーの2種類があります。残念ながら、これらのトリガーの中には、特に産業用コンピューティングアプリケーションではかなり一般的なものもあります。このため、RAMは8GBメモリで1時間の使用中に約5つのシングルビットエラーを簡単に経験する可能性があります。

ハードシングルビットエラー(物理的要因によって引き起こされる):

  • 電圧ストレス
  • 極端な温度
  • 衝撃と振動
  • 製造上の欠陥

ソフトシングルビットエラー(検出が困難な要因):

  • 不適切な読み取り/書き込みプロセス
  • 電磁干渉(EMI)
  • 電気的干渉
  • 磁気干渉
  • アルファ粒子
  • 宇宙線

エラー訂正コード(ECC)はビットフリップをどのように修正するか?

エラー訂正コードメモリは、エラー訂正コード(ECC)を使用して破損したデータを検出し、データをリアルタイムで修正します。ECCは、非バイナリの巡回エラー訂正コードを使用して、64ビットのデータごとに7ビットのパリティコードを追加することにより、高度な形式のパリティを使用してデータに暗号化されたコードを作成します。基本的なパリティは、ECCの7ビットのパリティコードと比較して、8ビットのデータごとに1つのパリティビットしか使用しません。バイナリ文字列の64ビットごとに7ビットを追加することで、ECC RAMはデータを検出するだけでなく、正しいデータを回復することができます。

高度なパリティは、最も一般的なエラー訂正コードの1つであるシングルエラー訂正とダブルエラー検出(SECDED)ハミングコードなどのECCを実行します。より新しく高速なECCは、ハミングエラー訂正システムよりも高速なトリプルモジュラー冗長(TMR)を使用します。暗号化からの追加データが必要なため、ECC RAMは、これらすべての暗号化コードをメモリから保存および計算するためにRAMカードにチップを追加する必要があります。このようにして、ECCメモリは9つのメモリチップを持ち、非ECCメモリは8つのメモリチップしか持たないのと比較されます。

復号化と暗号化のプロセスにより、ECC RAMから信頼性の高い計算が生成されますが、非ECC RAMと比較してわずかに速度が低下します。速度の低下は約1%〜2%であり、ECC RAMが提供する利点と比較するとそれほど大きな損失ではありません。

 ECC-memory-vs-non-ECC-memory 

ECCメモリと非ECCメモリの比較

 要素 ECCメモリ 非ECCメモリ 勝者
チップ数  9つのメモリチップ(ECC用1つ) 8つの揮発性メモリチップ ECC-memory
信頼性 超高信頼性(故障率0.09%) 通常(故障率0.6%)
ECC-memory
耐久性 24時間365日の使用に非常に耐久性がある 連続使用には耐久性が低い
ECC-memory
保護機能 データエラーを検出および回復可能 データエラーのみ検出可能
ECC-memory
速度  速度が遅い(Registered ECC RAMの場合1%〜2%遅い) 速度が速い(常に暗号化を必要としない) non-ECC-memory
価格 10-20%高価(追加のECCチップと供給不足のため) 安価(より主流で手頃な価格)
non-ECC-memory
消費電力 追加のECCチップのためにわずかに多くの電力を使用する可能性がある 8つのチップしかないECC RAMと比較して消費電力が少ない
non-ECC-memory
互換性 ECC対応CPU、マザーボード、チップセットのみで動作 幅広いCPU、マザーボード、チップセットで動作
non-ECC-memory

 

ECCメモリをサポートするCPU、マザーボード、またはチップセットとは?

ECCメモリをサポートするには、CPU、マザーボード、およびチップセットがECC RAMと互換性がある必要があります。サポートされていないモデルではECC RAMは動作しないか、ECC機能なしでRAMを実行するだけです。一般消費者向けのマザーボードとチップセットはECC RAMをサポートしないことが多いですが、サーバーグレードのマザーボードとチップセットはECC RAMをサポートします。さらに、ECC RAMをサポートするCPUは、Intel XeonサーバープロセッサやAMD Threadripper CPUなどのハイエンドサーバーCPUがECCメモリをサポートします。これらは、高性能で信頼性の高いコンピューティングが優先されるため、エンタープライズレベルのサーバーアプリケーションの標準仕様です。

ECCメモリが価値があるのはいつですか?

ECCメモリ全体の高コストなセットアップ費用は、消費者にとって費用の価値がないように見えるかもしれません。主に消費者は信頼性よりも速度を好むことが多いです。しかし、エンタープライズレベルのアプリケーションでは、ミッションクリティカルなアプリケーションが最も信頼性の高いシステムを必要とするため、ECCメモリフレームワークは不可欠な投資です。さらに、最適な冗長性はコストと時間を節約するだけでなく、展開エリア周辺の関係者の命さえも救うことができます。そのため、企業は極端な環境下でのさまざまな産業展開の信頼性を維持するために、コンピュータにECCメモリを利用しています。

ECCメモリを使用するアプリケーション:

  • サーバーとデータセンター
  • 産業用オートメーション
  • 医療産業
  • 金融機関
  • 軍事および防衛
  • 宇宙産業

ECCメモリとDDR5 RAMの未来 - これから何が待っているのか?

The-future-of-ECC-memory-and-DDR5-RAM

非ECC DDR4 RAMとは異なり、DDR5 SDRAMはチップにECCが組み込まれています。これにより、同じダイでより高い容量を持つ高密度RAMチップがECCを実行して潜在的なメモリエラーを回避できます。したがって、DDR5 RAMはデータをCPUに送信する前にビットフリップを検出して修正できます。しかし、これはDDR5 ECC RAMとは異なります。DDR5 ECC RAMもビットエラーを検出して修正しますが、専用のECCチップ上で行われ、一般消費者向けDDR5 RAMよりもはるかに強力で最適化されています。

 

ECCメモリをサポートする産業用サーバーグレードコンピュータ

Premioの最新の産業用コンピュータは、W480Eチップセットを搭載したIntel第10世代CoreおよびXeon-Wプロセッサによって提供される豊富なパフォーマンス強化を活用しています。Xeonプロセッサは、エッジコンピューティング展開におけるミッションクリティカルなデータ取得およびテレメトリーのための最も計算集約的なアプリケーションにおいて、堅牢で信頼性の高いパフォーマンスベンチマークのためのECCメモリサポートを保証します。

 

RCO-6000-CMLモジュラーAIエッジ推論コンピュータシリーズ

AI-Edge-Inference-Computer-with-ECC-memory-Support

主な特徴

  • 第10世代Intel® Core™ & Intel® Xeon® W プロセッサー、W480Eチップセット搭載
  • エラー訂正コード(ECC)メモリへのアクセス
  • 推論および機械学習ワークロード用のモジュラーEDGEBoostノード
  • プラグアンドプレイ対応デュアルSIM 5G & 4G/LTEセルラーネットワークモジュール
  • 多彩なI/Oによるエッジでのワークロード統合
  • 堅牢なエッジコンピューティング用に強化・テスト済み

 AIエッジ推論コンピュータの詳細

ACO-6000-CMLファンレス車載コンピュータシリーズ

fanless-in-vehicle-computers-with-ECC-memory-support

主な特徴

  • Intel® 第10世代CoreおよびXeon-Wプロセッサ、W480Eチップセット搭載
  • EN50155鉄道認証対応
  • 広範囲の電源入力 9-48VDCおよび48-110VDC
  • 最大18x LAN、16x PoE、16x USBをサポート
  • CANバス輸送プロトコル内蔵
  • 電源イグニッション管理
  • ECCメモリサポート
  • 5G対応

 ファンレス車載コンピュータの詳細

industrial-computer-manufacturers