概述
數據的激增,以及其所驅動的應用,正在帶來巨大的轉變。這些轉變要求專業化,以創建更能夠有效率地隨需應變地與 AI 工作負載互動的系統。
對於系統設計者來說,這意味著過去的效能加速策略可能不再適用。儘管基於 CPU/GPU 的設計有助於管理摩爾定律的減緩,但這些處理器架構現在正難以跟上自動化和推論應用中固有的即時數據要求。在更嚴苛的非資料中心情境中更是如此。加上要滿足性價比和功耗需求的日益嚴峻的挑戰,效能加速必須考量運算、儲存和連接性,這比以往任何時候都更加關鍵。所有這些因素對於有效地將工作負載整合到資料生成點附近是必要的,即使在環境挑戰不利於系統效能的惡劣環境中也是如此。
這就是M.2 外型尺寸加速器發揮作用的地方,它能消除數據密集型應用中的效能障礙。M.2 加速器是一個強大的設計選項,為系統架構師提供領域特定的價值,以符合 AI 工作負載的確切要求。與使用 CPU/GPU 技術的可比較系統相比,基於 M.2 的系統能夠更快、更有效率地管理推論模型。這些改進正在推動創新系統設計,非常適合堅固的邊緣運算,在這種環境中,更多系統部署在具挑戰性、非傳統的情境中,專用系統提供了巨大的機會。在這裡,通用嵌入式電腦與專為處理推論演算法而設計的電腦之間存在明顯區別,後者透過利用 M.2 加速模組等更現代的加速選項。
深入探討 M.2 和特定領域架構
加速器提供所需的巨大數據處理能力,填補了摩爾定律減速造成的空白。數十年來,摩爾定律一直是電子產業的驅動力。這個長期建立的原則斷言,晶片上的電晶體數量每 18 到 24 個月就會翻倍。然而,在 AI 方面,業界專家很快就指出摩爾定律出現疲態的跡象。矽的演進本身無法支援 AI 演算法及其所需的處理效能。為了平衡效能、成本和能源需求,新方法必須採用更專業化的特定領域架構 (DSA)。
DSA 經過客製化,可執行精心定義的工作負載,為確保效能提供基本原則,以促進深度學習訓練和深度學習推論。以 M.2 加速器為例,DSA 驅動的推論模型比依賴 CPU/GPU 技術的網路快 15 到 30 倍(能源效率提高 30 到 80 倍)。雖然通用 GPU 可以為先進 AI 演算法提供必要的巨大處理能力,但它們不適用於邊緣部署,尤其是在偏遠或不穩定的環境中。除了 GPU 本身的預付成本外,功耗、尺寸和散熱管理的缺點會導致更高的營運成本。M.2 加速模組和專用加速器(例如 Google 的 TPU)具有高能效、體積小巧,專為在邊緣以更小的外形和更少的功耗預算下,以令人難以置信的效能運行機器學習演算法而設計。

為何選擇 M.2?
M.2 又稱作「新一代外形尺寸介面」,由 Intel 開發,提供彈性和強固的效能。M.2 支援多種訊號介面,例如 Serial ATA (SATA 3.0)、PCI Express (PCIe 3.0 和 4.0) 和 USB 3.0。M.2 擴充插槽具有多種匯流排介面,高度適應不同的效能加速器、儲存協定、I/O 擴充模組和無線連接。
M.2 也透過支援 SATA 和 NVMe (非揮發性記憶體 Express) 儲存協定,提供舊版和現代兼容性。舊版標準 SATA 包含進階主機控制器介面 (AHCI),並由 Intel 定義為優化透過 HDD (硬碟) 儲存中的旋轉金屬碟片進行數據操作的儲存協定。NVMe 則提供了一種替代方案,旨在充分利用 NAND 晶片 (快閃) 儲存和 PCI Express Lane,實現極快的固態硬碟 (SSD) 儲存。
效能加速器也採用了 M.2 外形尺寸,受惠於其強大且緊湊的介面。這些加速器包括 AI 加速器、記憶體加速器、深度學習加速器、推論加速器等等。這些專用處理器專用於 AI 工作負載,提供更佳的功率效能比。
在更多環境中透過即時數據效能釋放 AI 潛力
數據是當今商業創新的關鍵,更重要的是,是提供認知機器智能的能力。無論是為先進車載資通訊系統或智慧亭提供動力,無論是在工廠車間,還是在火車站和機場等基礎設施設施中駕駛乘客和監控服務,數據無處不在,並且在能夠即時發現、捕捉、評估和使用時最有價值。
眾多產業都渴望充分利用數據來創造新服務並提升業務決策,但在許多嚴苛的工業環境中,在資料中心層級處理小型自動化或 AI 任務效率太低,無法提供真正的價值。由於過度但必要的運算、頻寬和儲存資源使用,這種傳統集中式運算架構的功耗和成本過高。此外,高延遲意味著效能會受到影響,而數據隱私不足又帶來另一個問題。
數據增長,加上邊緣運算環境的複雜性,正在將 AI 運算框架從通用 CPU/GPU 選項轉向基於 M.2 標準的特定領域架構的專用加速器——這些選項更小、更節能。這是一種應對複雜、真實且不會消失的數據挑戰的策略。隨著物聯網 (IoT) 和工業物聯網 (IIoT) 設備數量的增加,它們產生的數據量和速度也在增加。應用設計師和開發人員必須認識到,迫切需要更接近數據源的效能加速,並且專為手頭任務而設計——尤其是在部署邊緣運算硬體以處理數據並減輕資料中心和雲端相關負擔的情況下。
本部落格文章最初由 EdgeIR 發布。點擊這裡造訪已發布的客座文章。
