デジタル革命の台頭
かねてよりIT業界では、個人向けであれ企業向けであれ、アナログライフをデジタルライフに移行させるというアイデアを盛んに提唱してきました。良くも悪くも、私たちの生活をより簡単に、より生産的にし、日々の生活においてより大きな効率性を実現すると約束するこのデジタル革命の影響を、私たちは皆受けています。消費者として、私たちはデジタルの恩恵を享受できることは間違いありません。このアプローチは有望に聞こえますが、IT業界はこの夢を実現する上でより大きな課題に直視しています。
データ洪水の時代
2014年のIDCレポートによると、デジタル技術は2013年に指数関数的に成長し、同時に膨大なデジタル機会を提供しています。現在、デジタルユニバースには4.4ゼタバイト(440億テラバイト)のデータがあり、2020年には44ゼタバイトにまで10倍に成長すると予測されています。この状況を分かりやすく説明すると、2013年に厚さ0.29インチのタブレットに128GBのストレージがあったと仮定して、それらを積み重ねると、地球から月までの距離の約2/3を覆うことができます。2020年には、これが確実に6.6倍に増えるでしょう。

出典: EmergingTechBlog
別の言い方をすれば、44ゼタバイトは880億年間音楽を聴き続ける、あるいは14億年間HDビデオを連続視聴し続けることに相当します。

モノのインターネットの成長
与えられた情報を理解すると、これほど多くのデジタルデータを生成できるのはどうしてなのか不思議に思うことでしょう。これには簡単な説明があります。これらのデータの生成には、消費者と企業という2つの主要な要因が関係しています。ラップトップ、スマートフォン、ウェアラブルデバイス、テレビから、食器洗い機、冷蔵庫、スマートカー、交通センサー、インフォテインメント、ガソリンスタンドのポンプ、ロボット機械、スマートビルディングなどに至るまで、「モノのインターネット」と呼ばれるデバイスは200億個存在します。地球の人口が2020年に77億人に達すると仮定すると、これは2020年には320億個のデバイスに、つまり一人あたり約4個のデバイスに増加するでしょう。私たちが使用しているこれらすべてのデバイスは、多くのデータを生成し、消費することができます。最近の調査によると、2014年には毎分、Netflixで5万時間のビデオがストリーミングされ、Googleには400万件の検索が届き、27万7千件のツイートが投稿されました。
様々なデジタルソースから生成されるデジタルデータが爆発的に増加しているため、デジタルユニバースは大きすぎて処理しきれなくなるでしょう。これはIT業界全体にとって、大きな、そして困難な課題となるでしょう。同じIDCのレポートによると、2013年に作成された4.4ゼタバイトのデータのうち、消費者が管理したのはわずか15%であり、企業やIT部門が残りの85%のデータの使用を担っています。

出典: DellEMC
ビッグデータストレージの課題

IT業界と企業が直面しなければならない課題を理解するためには、まず「ビッグデータ」の要求とは何かを理解し、分類する必要があります。ガートナーは、ビッグデータには3つの「V」があると定義しています。これらはボリューム(Volume)、ベロシティ(Velocity)、バラエティ(Variety)です。その後、2014年にベストセラー作家のBernard Marrは、これら3つの「V」を5つの「V」に拡張し、さらに正確性(Veracity)と価値(Value)を追加しました。
ボリューム(Volume)
ボリュームとは、毎秒生成される膨大な量のデータを指します。メール、Twitterメッセージ、写真、ビデオクリップ、センサーデータなど、私たちが毎秒作成し、共有しているものすべてを考えてみてください。私たちはテラバイトではなく、ゼタバイトについて話しています。Facebookだけでも、毎日100億件のメッセージが送信され、「いいね!」ボタンは45億回クリックされ、3億5000万枚の新しい写真が毎日アップロードされています。世界の始まりから2008年までに生成されたすべてのデータを合わせると、同じ量のデータが間もなく毎分生成されることになります!量の増加により、データセットは従来のデータベース技術では保存および分析するには大きすぎます。この膨大なデータに対しては、高度にスケーラブルなストレージシステムを使用してデータセットを保存および利用できるテクノロジーが本当に必要であり、データの一部が異なる場所に保存され、ソフトウェアによってまとめられる必要があります。
ベロシティ(Velocity)
ベロシティとは、新しいデータが生成される速度と、データが移動する速度のことです。ソーシャルメディアのメッセージが数秒で拡散する速度、クレジットカード取引が不正行為をチェックされる速度、または取引システムがソーシャルメディアネットワークを分析して株の売買を決定するシグナルを拾うのにかかるミリ秒といったことを考えてみてください。ビッグデータ技術は、生成されると同時に、可能な限り低い遅延で、ミリ秒、あるいはマイクロ秒でデータを取得し分析することを要求しています。
バラエティ(Variety)
バラエティとは、現在利用できるさまざまな種類のデータを指します。以前は、金融データ(製品別または地域別の売上など)のような、ほぼテーブルやリレーショナルデータベースに収まる構造化データに単純に焦点を当てていました。実際、世界のデータの80%は現在非構造化データであり、そのためテーブルに簡単に入れることはできません(写真、ビデオシーケンス、ソーシャルメディアの更新などを考えてみてください)。ビッグデータは、メッセージ、ソーシャルメディアの会話、写真、センサーデータ、ビデオや音声の録音など、さまざまな種類のデータ(構造化データと非構造化データ)を活用し、より伝統的な構造化データと組み合わせて利用することを要求しています。
ベラシティ(Veracity)
数えきれないほどのビッグデータ形式があるため、品質と正確性は容易に制御できません(ハッシュタグ、略語、誤字、口語表現を含むTwitterの投稿や、コンテンツの信頼性と正確性がその最たる例です)。それに加えて、ビットエラーが発生しやすいストレージシステムへの読み書きされるこれらすべてのビットとバイトを考えてみてください。ハードウェア障害の可能性は言うまでもありません。これらすべての高速なデータベロシティは、品質と正確性も必要とします。
価値(Value)
最後に、ビッグデータを検討する際に考慮すべき最後のVがあります。それは「価値」です!ビッグデータにアクセスできるのは良いことですが、それを価値に変えることができなければ無意味です。したがって、「価値」がビッグデータの最も重要なVであると安全に主張できます。企業がビッグデータを収集し活用しようとする際には、ビジネスケースを作成することが重要です。コストとメリットを明確に理解せずに、流行の罠にはまってビッグデータイニシアチブに乗り出すのは非常に簡単です。
これらの課題すべてに直面し、IT業界と企業は、ハードウェアとソフトウェアの両面で将来のストレージ技術を再考し、再発明し、これらが一体となってシームレスに機能するようにする必要があります。
ストレージハードウェア
20世紀のコンピュータ革命以来、私たちは確かに大きく進歩しました。1960年代には、たった1台のコンピュータがIT部門全体の部屋を埋め尽くし、ごく基本的な計算しかできないものでした。考えてみれば、これは現在のスマートフォンができることのほんの一部にすぎません。ムーアの法則のおかげで、半導体は毎年、そして数十年ごとに進化し続けています。
しかし、特定のストレージ技術について言えば、私たちは依然として半世紀以上も前の技術であるテープドライブや機械式回転ドライブを扱っています。
フラッシュが救世主
以下のグラフは、DRAMとCPUが高速化する一方で、テープと回転式ハードディスクがムーアの法則に追いつけず、その差が拡大していることを示しています。幸いなことに、フラッシュ技術のおかげでこのギャップを埋めることが可能になりました。現在のSATA SSDの性能を比較すると、約100,000 IOPSを提供できるのに対し、15K RPMエンタープライズレベルのハードディスクはわずか200 IOPSしか提供できません。ハードディスクの1,000倍の容量増加が見て取れます。現在、容量という点ではハードディスクがまだ優位に立っています(本記事執筆時点では、4TB、6TB、さらには8TBのハードディスクが簡単に入手できます)。SSDの現在の最大容量は約4TBです。しかし、ストレージ密度に関しては、SSDフラッシュが間違いなくトップの座を占めます。さらに、今後12~24ヶ月で、主要なSSDメーカーはすべて8TBまたは12TBのSSDを提供できるようになるでしょう。
では、テープとHDDは絶滅するのでしょうか?おそらくまだ、少なくとも近い将来や今後数年間ではないでしょう。ハードディスクとテープの現在のコストは、フラッシュSSDのコストのほんの一部です。しかし、Gartnerの以下のグラフによると、SSDはすぐに追いつくかもしれません。2017年は、エンタープライズHDDとエントリーレベルSSDの価格が同等になる年となるでしょう。また、2017年までに、低コストのデータセンターHDDは、SSDのコストの少なくとも20%を占める可能性が高いことにも留意する必要があります。したがって、回転式ドライブは市場での可視性をまだ維持する可能性があります。
Premioでは、コストと性能それぞれの理由から、ハードドライブとフラッシュドライブの両方のテクノロジーを採用しています。重要なのは、それぞれのドメインで両方のテクノロジーをどのように活用し、ハイブリッドストレージを作成するかです。フラッシュドライブは、ホットデータが存在する必要がある場所や、ティア1または「最も使用される」キャッシュデータに最適です。一方、回転式ドライブは、パフォーマンスが重要ではなく、GBあたりのコストがより重要となるコールドストレージや長期ストレージにデータを保存するのに、より費用対効果が高いです。
これは、当社の製品群に、フラッシュディスクアレイ専用のFlacheStreamsと、大容量バックアップストレージ用のScaleStreamsがある理由の一部です。さらに、DuraStreamsやOmniStreamsなど、一部の製品には、ハイブリッドストレージソリューションとして同じ筐体内にフラッシュとハードドライブが搭載されています。
当社のサーバー製品とそのビジネスへの貢献について詳しく知りたい場合は、今すぐお問い合わせください。