
這篇部落格文章涵蓋的內容有:
- 什麼是 AI 影像分析
- AI 影像分析的運作方式
- 產業應用和優勢
- AI 影像分析的硬體要求
什麼是 AI 影像分析?
AI 影像分析,又稱作影像內容分析(VCA)、影像 AI 或智慧影像,指的是從數位影像中收集到的數據,分析並推斷出可執行的洞察和結論的過程。
AI 影像分析簡化並減輕了人類長時間觀察影像重複而繁瑣的任務。AI 不僅能觀察數據,還能透過大量的影像片段進行訓練,以偵測、識別、分類和自動標記特定物件。
總體而言,它是一種輔助人類理解影像內容的工具,並能根據收集到的數據進行自動化決策。
AI 影像監控系統的關鍵組成部分
為了全面了解 AI 影像分析,讓我們深入探討其運作原理。這個過程結合了兩種 AI 類型,即機器學習和深度學習。但在開始之前,讓我們先簡要定義一下 AI。
AI、機器學習和深度學習
人工智慧
AI 代表人工智慧,是一個利用電腦科學和數據解決機器問題的領域(Coursera,2023)。人工智慧的創始人之一 John McCarthy 在 1955 年將 AI 定義為「製造智慧機器的科學和工程」。AI 是一個龐大的主題,一時間難以全面理解,因此我們將從 AI 的三個階段開始介紹。
AI 可以分為三個發展階段。

第一階段是人工窄智慧 (ANI),指的是電腦可以執行簡單且定義明確的任務,且僅限於這些任務。我們今天大多數的 AI 工具都屬於這一類,例如語音或臉部辨識。
第二階段是人工通用智慧(AGI),在這個階段,AI 被認為能夠像人類一樣獨立做出決策和思考。隨著我們看到 ChatGPT 等社交聊天機器人的快速發展,它們能夠進行上下文推理和解決問題,人們相信這個階段即將到來。這個階段比前一個階段更先進,可以與人類智慧相媲美。
判斷機器人是否達到與人類相同智慧水平的方法是透過 Alan Turing(1950)的圖靈測試。如果 AI 和人類之間的對話被錄音,而觀察者在聽完對話後無法分辨兩者,我們就達到了 AGI。
最後是超級人工智慧(ASI),AI 的智慧遠遠超越人類。這個階段也被描述為技術奇點,這是一個假設的未來時間點。
機器學習和深度學習
現在,讓我們深入探討 AI 影像中涉及的 AI 類型。AI 有多個子集,這些子集中又包含子集,但 AI 影像所需的兩種是機器學習和深度學習。深度學習包含在機器學習中,如下圖所示。

你曾經想過 Netflix 上的「為你精選」是如何策劃的嗎?
或許在某個晚上看完電影後,推薦的電影會出現類似的主題,並且屬於相同的類型。或者當 YouTube 自動播放神奇地編排你喜歡的音樂播放清單時。這些都是機器學習在日常生活中運作的例子。
機器學習是人工智慧的一個子集,利用演算法分析數據,從已收集的資訊中學習,然後將這些知識應用於未來決策,且幾乎不需要人為干預。
因此,機器不再需要人類為每個決策進行編碼,而是透過收集、處理和學習數據來進行「訓練」,然後自行做出決策。隨著時間的推移,機器學習演算法可以透過累積的經驗來改進任務。

深度學習是機器學習的一個子集,它利用人工「神經網路」來模仿人類大腦的學習過程。深度學習模仿人類大腦非線性處理資訊的方式,如上圖所示。
這些人工神經網路是由演算法和運算單元的「層」構成,這些「層」組成了人工神經元。這些神經元是深度學習演算法的骨幹。區分機器學習和深度學習的一種方法是看電腦必須處理的數據層數。如果處理層數超過三層(包括輸入和輸出),則被視為深度學習。
機器學習可以透過學習和分析預先分類的數據,成為特定功能的專家,而深度學習能夠吸收更大、更多樣化且非結構化的原始數據集,包括圖片、文本和數字,從中學習。透過連續和大量的數據輸入,深度學習演算法可以從其收集的數據群集中觀察到的模式中學習。
深度學習可以自動學習和直接從原始數據中提取特徵,這消除了手動特徵工程的需要。深度神經網路旨在學習數據的分層表示,其中數據在多個詳細層次上進行觀察,從最簡單的模式和邊緣或梯度,到檢測更獨特特徵的更高級別。
可以將深度學習視為一種更先進和更成熟的機器學習類型,它能夠處理複雜的數據集,並消除了工程師明確編碼和分類數據集的需要,從而使數據處理和學習速度更快,效率更高。
AI 影像分析如何運作?
現在我們已經介紹了「是什麼」,接下來讓我們來探討「如何運作」。
AI 影像分析採用一種稱為「物件識別」的技術。物件識別利用深度學習。這項技術屬於機器視覺領域,這是電腦科學的一個分支,專門研究電腦如何「看」。

物件識別
參照上圖,根據 Jason Brownlee (2019) 的說法,物件識別指的是一系列相關任務,用於識別數位照片中的物件。
第一個任務是影像分類,它會預測影像中物件的類別。
第二個任務稱為物件定位,它利用邊界框和類別標籤來識別影像中物件的位置。
然後,物件偵測結合了這兩項任務,對影像中偵測到的物件進行分類和定位。「物件識別」一詞通常用於物件偵測任務。物件偵測是物件識別的一個子集。
為何使用 AI 影像分析?
AI 影像分析為企業帶來許多好處,包括:
- 強化安全措施
- 最佳化營運效率
- 確保員工健康安全
- 事件調查與分析
關於 AI 影像分析在物聯網監控中的 5 個應用範例,請查看這篇部落格文章。
為什麼在邊緣運算 AI 視訊分析?
隨著嵌入式裝置的效能能力提升,更多資料在資料收集地點進行處理。AI 視訊分析在邊緣而非雲端執行的原因包括:
降低延遲
當 AI 視訊在邊緣運算時,這會最大限度地減少接收回應所需的時間,因為無需在雲端來回傳輸資料。這對於需要即時採取行動的情況產生巨大影響,並顯著改善安全和監控方面的條件。
提高隱私和安全性
由於分析是在資料收集的地方進行,而不是在資料可能被駭客入侵的網路上進行,因此可減少漏洞。這在分析儲存個人識別資訊 (例如臉部辨識資料) 的資料時是一項額外的好處。
頻寬效率
企業受惠於邊緣運算的頻寬效率,因為只有需要進一步處理的必要資料才會傳送至雲端。這可釋放更多頻寬容量,並降低資料傳輸成本和能源消耗。
離線操作
即使沒有網際網路連線,AI 視訊運算仍可在邊緣進行。這在網路連線可能中斷或在偏遠地區有時無法使用的地方尤其有利。
即時決策
在邊緣運算 AI 視訊分析的一個吸引人的目的是,電腦能夠獨立計算和執行關鍵任務決策,如果需要在雲端層級進行進一步分析,可能會導致等待時間更長,從而產生嚴重後果。
增強的可擴展性
當 AI 視訊在感測器本身進行分析時,這可改善並為可擴展性創造空間,因為它允許更多裝置承擔資料處理和分析的負載。在多個邊緣裝置上實現平行任務執行可減輕負載並有效地分配任務。
工業運算系統需要什麼才能運行 AI 視訊?
通常,負責 AI 視訊分析的電腦會放置在不利的惡劣環境中,這些環境包括灰塵和空氣傳播顆粒含量高的偏遠地區、靠近其他移動物體的搖晃或移動地面,或溫度波動劇烈且氣候變化劇烈的戶外環境,甚至暴露在高濕度或空氣噴霧中。這些條件對這些系統施加了額外的壓力,除了 AI 視訊中涉及的持續和嚴苛的資料處理級別的軟體相容性要求之外。
用於 AI 視訊分析的硬體加速器
邊緣的惡劣條件要求系統能夠 24/7 穩定運行而不會中斷,因為它們執行關鍵任務功能,例如無風扇、堅固耐用的工業電腦。
在工業應用中使用 AI 視訊分析時,需要考慮特定的硬體要求才能獲得最佳效能和令人滿意的結果。
首先,強大的處理器對於處理 AI 演算法中涉及的複雜計算至關重要。用於 AI 視訊分析的工業運算系統通常包括用於進階影像處理能力的 GPU (圖形處理單元)。
專用 AI 加速器,如 ASIC (特殊應用積體電路),例如 Google 的張量處理單元 (TPU) 和 HAILO,可加速邊緣裝置上的嵌入式深度學習應用程式。FPGA (現場可程式邏輯閘陣列) 也常用於高效的平行處理。
然後,需要充足的記憶體,包括 RAM 和儲存,以有效率地儲存和存取大量資料。高速儲存解決方案,例如 NVMe SSD (非揮發性記憶體 Express 固態硬碟),可促進快速資料檢索。
最後,與 AI 語言模型和軟體框架的相容性可確保 AI 功能的順暢整合和利用。
我們不會在此深入探討每個加速器,但如果您想了解更多,請查看這篇關於運算硬體中效能加速器的部落格。
用於 AI 視訊分析的 RCO-3000-CML 和 RCO-6000-CML
Premio 提供的模組化、堆疊式、兩件式磚塊設計,可實現無風扇、堅固耐用的工業 PC,並配備可熱插拔的 NVME SSD。這加速了 RCO-3000 和 RCO-6000 系列用於物體偵測和高效 AI 視訊分析,同時即時產生顯示輸出。這種經過深思熟慮的設計內建了安全功能,使操作員無需更換整個運算系統即可輕鬆進行升級和維修。RCO 系列是任何惡劣工業環境中機器視覺任務的具競爭力的解決方案。