以AI為基礎的影像分析。它是什麼？它是如何運作的？

AI Video Analytics

AI 影像分析廣泛應用於各行各業，例如：安全與監控、餐飲、零售、交通運輸、製造和物流等等。根據 MarketsandMarkets 分析報告（2022 年），預計到 2026 年，影像分析市場的複合年成長率（CAGR）將達到 20.9%；隨著邊緣 AI 技術的廣泛應用，AI 影像分析在未來幾年將會變得越來越強大。

這篇部落格文章涵蓋的內容有：

什麼是 AI 影像分析
AI 影像分析的運作方式
產業應用和優勢
AI 影像分析的硬體要求

什麼是 AI 影像分析？

AI 影像分析，又稱作影像內容分析（VCA）、影像 AI 或智慧影像，指的是從數位影像中收集到的數據，分析並推斷出可執行的洞察和結論的過程。

AI 影像分析簡化並減輕了人類長時間觀察影像重複而繁瑣的任務。AI 不僅能觀察數據，還能透過大量的影像片段進行訓練，以偵測、識別、分類和自動標記特定物件。

總體而言，它是一種輔助人類理解影像內容的工具，並能根據收集到的數據進行自動化決策。

AI 影像監控系統的關鍵組成部分

為了全面了解 AI 影像分析，讓我們深入探討其運作原理。這個過程結合了兩種 AI 類型，即機器學習和深度學習。但在開始之前，讓我們先簡要定義一下 AI。

AI、機器學習和深度學習

人工智慧

AI 代表人工智慧，是一個利用電腦科學和數據解決機器問題的領域（Coursera，2023）。人工智慧的創始人之一 John McCarthy 在 1955 年將 AI 定義為「製造智慧機器的科學和工程」。AI 是一個龐大的主題，一時間難以全面理解，因此我們將從 AI 的三個階段開始介紹。

AI 可以分為三個發展階段。

The Three Stages of AI

第一階段是人工窄智慧 (ANI)，指的是電腦可以執行簡單且定義明確的任務，且僅限於這些任務。我們今天大多數的 AI 工具都屬於這一類，例如語音或臉部辨識。

第二階段是人工通用智慧（AGI），在這個階段，AI 被認為能夠像人類一樣獨立做出決策和思考。隨著我們看到 ChatGPT 等社交聊天機器人的快速發展，它們能夠進行上下文推理和解決問題，人們相信這個階段即將到來。這個階段比前一個階段更先進，可以與人類智慧相媲美。

判斷機器人是否達到與人類相同智慧水平的方法是透過 Alan Turing（1950）的圖靈測試。如果 AI 和人類之間的對話被錄音，而觀察者在聽完對話後無法分辨兩者，我們就達到了 AGI。

最後是超級人工智慧（ASI），AI 的智慧遠遠超越人類。這個階段也被描述為技術奇點，這是一個假設的未來時間點。

機器學習和深度學習

現在，讓我們深入探討 AI 影像中涉及的 AI 類型。AI 有多個子集，這些子集中又包含子集，但 AI 影像所需的兩種是機器學習和深度學習。深度學習包含在機器學習中，如下圖所示。

你曾經想過 Netflix 上的「為你精選」是如何策劃的嗎？

或許在某個晚上看完電影後，推薦的電影會出現類似的主題，並且屬於相同的類型。或者當 YouTube 自動播放神奇地編排你喜歡的音樂播放清單時。這些都是機器學習在日常生活中運作的例子。

機器學習是人工智慧的一個子集，利用演算法分析數據，從已收集的資訊中學習，然後將這些知識應用於未來決策，且幾乎不需要人為干預。

因此，機器不再需要人類為每個決策進行編碼，而是透過收集、處理和學習數據來進行「訓練」，然後自行做出決策。隨著時間的推移，機器學習演算法可以透過累積的經驗來改進任務。

Deep Neural Networks

深度學習是機器學習的一個子集，它利用人工「神經網路」來模仿人類大腦的學習過程。深度學習模仿人類大腦非線性處理資訊的方式，如上圖所示。

這些人工神經網路是由演算法和運算單元的「層」構成，這些「層」組成了人工神經元。這些神經元是深度學習演算法的骨幹。區分機器學習和深度學習的一種方法是看電腦必須處理的數據層數。如果處理層數超過三層（包括輸入和輸出），則被視為深度學習。

機器學習可以透過學習和分析預先分類的數據，成為特定功能的專家，而深度學習能夠吸收更大、更多樣化且非結構化的原始數據集，包括圖片、文本和數字，從中學習。透過連續和大量的數據輸入，深度學習演算法可以從其收集的數據群集中觀察到的模式中學習。

深度學習可以自動學習和直接從原始數據中提取特徵，這消除了手動特徵工程的需要。深度神經網路旨在學習數據的分層表示，其中數據在多個詳細層次上進行觀察，從最簡單的模式和邊緣或梯度，到檢測更獨特特徵的更高級別。

可以將深度學習視為一種更先進和更成熟的機器學習類型，它能夠處理複雜的數據集，並消除了工程師明確編碼和分類數據集的需要，從而使數據處理和學習速度更快，效率更高。

在此處了解更多關於深度學習的資訊

AI 影像分析如何運作？

現在我們已經介紹了「是什麼」，接下來讓我們來探討「如何運作」。

AI 影像分析採用一種稱為「物件識別」的技術。物件識別利用深度學習。這項技術屬於機器視覺領域，這是電腦科學的一個分支，專門研究電腦如何「看」。

Tasks In Image Recognition

物件識別

參照上圖，根據 Jason Brownlee (2019) 的說法，物件識別指的是一系列相關任務，用於識別數位照片中的物件。

第一個任務是影像分類，它會預測影像中物件的類別。

第二個任務稱為物件定位，它利用邊界框和類別標籤來識別影像中物件的位置。

然後，物件偵測結合了這兩項任務，對影像中偵測到的物件進行分類和定位。「物件識別」一詞通常用於物件偵測任務。物件偵測是物件識別的一個子集。

在此處了解更多關於機器視覺的資訊。

為何使用 AI 影像分析？

AI 影像分析為企業帶來許多好處，包括：

強化安全措施
最佳化營運效率
確保員工健康安全
事件調查與分析

關於 AI 影像分析在物聯網監控中的 5 個應用範例，請查看這篇部落格文章。

為什麼在邊緣運算 AI 視訊分析？

隨著嵌入式裝置的效能能力提升，更多資料在資料收集地點進行處理。AI 視訊分析在邊緣而非雲端執行的原因包括：

降低延遲

當 AI 視訊在邊緣運算時，這會最大限度地減少接收回應所需的時間，因為無需在雲端來回傳輸資料。這對於需要即時採取行動的情況產生巨大影響，並顯著改善安全和監控方面的條件。

提高隱私和安全性

由於分析是在資料收集的地方進行，而不是在資料可能被駭客入侵的網路上進行，因此可減少漏洞。這在分析儲存個人識別資訊 (例如臉部辨識資料) 的資料時是一項額外的好處。

頻寬效率

企業受惠於邊緣運算的頻寬效率，因為只有需要進一步處理的必要資料才會傳送至雲端。這可釋放更多頻寬容量，並降低資料傳輸成本和能源消耗。

離線操作

即使沒有網際網路連線，AI 視訊運算仍可在邊緣進行。這在網路連線可能中斷或在偏遠地區有時無法使用的地方尤其有利。

即時決策

在邊緣運算 AI 視訊分析的一個吸引人的目的是，電腦能夠獨立計算和執行關鍵任務決策，如果需要在雲端層級進行進一步分析，可能會導致等待時間更長，從而產生嚴重後果。

增強的可擴展性

當 AI 視訊在感測器本身進行分析時，這可改善並為可擴展性創造空間，因為它允許更多裝置承擔資料處理和分析的負載。在多個邊緣裝置上實現平行任務執行可減輕負載並有效地分配任務。

工業運算系統需要什麼才能運行 AI 視訊？

通常，負責 AI 視訊分析的電腦會放置在不利的惡劣環境中，這些環境包括灰塵和空氣傳播顆粒含量高的偏遠地區、靠近其他移動物體的搖晃或移動地面，或溫度波動劇烈且氣候變化劇烈的戶外環境，甚至暴露在高濕度或空氣噴霧中。這些條件對這些系統施加了額外的壓力，除了 AI 視訊中涉及的持續和嚴苛的資料處理級別的軟體相容性要求之外。

用於 AI 視訊分析的硬體加速器

邊緣的惡劣條件要求系統能夠 24/7 穩定運行而不會中斷，因為它們執行關鍵任務功能，例如無風扇、堅固耐用的工業電腦。

在工業應用中使用 AI 視訊分析時，需要考慮特定的硬體要求才能獲得最佳效能和令人滿意的結果。

首先，強大的處理器對於處理 AI 演算法中涉及的複雜計算至關重要。用於 AI 視訊分析的工業運算系統通常包括用於進階影像處理能力的 GPU (圖形處理單元)。

在此了解 CPU、GPU 和 TPU 的差異。

專用 AI 加速器，如 ASIC (特殊應用積體電路)，例如 Google 的張量處理單元 (TPU) 和 HAILO，可加速邊緣裝置上的嵌入式深度學習應用程式。FPGA (現場可程式邏輯閘陣列) 也常用於高效的平行處理。

然後，需要充足的記憶體，包括 RAM 和儲存，以有效率地儲存和存取大量資料。高速儲存解決方案，例如 NVMe SSD (非揮發性記憶體 Express 固態硬碟)，可促進快速資料檢索。

最後，與 AI 語言模型和軟體框架的相容性可確保 AI 功能的順暢整合和利用。

我們不會在此深入探討每個加速器，但如果您想了解更多，請查看這篇關於運算硬體中效能加速器的部落格。

用於 AI 視訊分析的 RCO-3000-CML 和 RCO-6000-CML

Premio 提供的模組化、堆疊式、兩件式磚塊設計，可實現無風扇、堅固耐用的工業 PC，並配備可熱插拔的 NVME SSD。這加速了 RCO-3000 和 RCO-6000 系列用於物體偵測和高效 AI 視訊分析，同時即時產生顯示輸出。這種經過深思熟慮的設計內建了安全功能，使操作員無需更換整個運算系統即可輕鬆進行升級和維修。RCO 系列是任何惡劣工業環境中機器視覺任務的具競爭力的解決方案。

最新文章：

工業觸控螢幕電腦和顯示器

超級電容器技術

什麼是 AI 影像分析？