從雲端到邊緣的數據洞察

隨著企業雲端供應商對高效能處理、儲存和連接的需求日益增長,專用硬體伺服器將改變傳統橫向擴展架構存取、傳輸和儲存海量資料的方式。為了滿足資料中心乃至邊緣運算的現代需求,新型硬體架構需要採用最新技術。傳統的機架式伺服器設計正在迅速變革,以實現更快、更有效率的即時數據處理,從而推動新一代人工智慧的發展。

DPU 加速伺服器將資料中心架構中的最新技術融合在一起,從而實現了從資料中心網路到邊緣的運算能力、效率和可擴展性的新效能基準。


數據處理。性能加速至關重要。

Performance Increase

高效能運算(HPC)

工業4.0和智慧生產圖示集,涵蓋智慧工業革命、自動化、機器人助理、雲端運算和創新等領域。庫存插圖[已轉換]

機器學習

Premio_Icon_產品簡介

深度學習

Premio_Icon_產品簡介

資料分析 Web 2.0

Premio_Icon_產品簡介

雲端管理

Premio_Icon_產品簡介

海量資料存儲


FlacheStreams DPU 加速伺服器

FlacheStreams DPU 加速機架式伺服器設計提供高效能,支援基於最新 CPU、GPU 和 DPU 技術的新型架構。這款專用伺服器可應對當今現代基礎架構中最複雜的資料中心工作負載,適用於公有雲、私有雲和混合雲模型,滿足對卓越硬體加速的雙重需求。

身體的:

  • 2U機架式機殼
  • 12 個獨特的 DPU 卡熱插拔托架
  • 單顆 AMD EPYC 處理器、雙顆 AMD EPYC 處理器或英特爾可擴充處理器

連接性:

  • 最多可配備 36 個 25Gb/s 網路加速端口
  • 用於點對點通訊的 2x 96 頻道 PCIe 交換板
  • 2 個千兆乙太網路 RJ45 端口,1 個 IPMI 管理 RJ45 端口

可擴充性:

  • 最多可擴充至 18 個 DPU 或 14 個 DPU + 2 個全高雙寬 350W GPGPU
  • 支援高達 300TB 以上的 NVMe SSD 存儲
  • CPU核心數:從8核心到128核
  • 最多 18 個 8 核心 Armv8 A72 (64 位元) DPU 加速器

硬體加速:

  • 壓縮和解壓加速
  • NVMe-oF™ 加速
  • SR-IOV
  • TCP/IP傳輸卸載

產品系列:

FlacheSAN2N12C-DM 2U 12 雙 AMD EPYC DPU 伺服器

  • 2顆AMD EPYC Milan CPU,最高可達128個核心
  • 4TB RDIMM 3200MHz
  • 16 個 PCIe 擴充卡插槽

FlacheSAN2N12C-UM 2U 12 單 AMD EPYC DPU 伺服器

  • 1 顆 AMD EPYC Milan CPU,最高可達 64 核心
  • 4TB RDIMM 3200MHz
  • 16 個 PCIe 擴充卡插槽

FlacheSAN2N12C-D5 2U 12 雙英特爾可擴充處理器 DPU 伺服器

  • 2 個英特爾可擴充處理器
  • 16 位元 RDIMM 2933MHz
  • 16 個 PCIe 擴充卡插槽

如何配置DPU加速伺服器?

網路應用:

支援智慧網路卡/FPGA/加速器,以減輕 CPU 的工作負載,提高網路吞吐量並降低延遲。

儲存應用:

12 個 PCIe 3.0 x8 擴充卡插槽,用於 NVMe SSD 設備,可儲存高達 300TB 的資料。

計算應用:

128 個 AMD EPYC 核心(2 個 64 核心)、2 個雙倍寬度 GPU 和多達 18 個 DPU 運算 SSD 使客戶能夠運行運算要求最高的應用程式。

高效能運算應用:

該系統配備兩塊 96 通道交換板,分別擴展至 12 個 PCIe x8 擴充卡和 4 個 PCIe x16 擴充卡,使智慧網路卡和固態硬碟能夠透過點對點 DMA 進行通訊。這樣一來,便可消除不必要的資料傳輸,進而降低延遲並提升運算資源利用率。


資料中心的硬體加速

如今的資料中心仍然主要依賴基於 x86 CPU 的計算。然而,隨著摩爾定律對半導體創新構成越來越大的挑戰,資料中心基礎設施需要更新的技術和方法來提升現有硬體的效能。現今的資料中心解決方案仰賴各種效能加速技術,以滿足人工智慧驅動型應用中對更快處理速度、儲存速度、網路速度和安全速度的運算需求。

  • 2020年第四季度,X86伺服器的營收為209.3億美元,佔所有伺服器收入的92.8%(IDC)。
  • 現代資料中心基礎架構利用 CPU、GPU、DPU 和 FPGA 等硬體技術來實現效能驅動的橫向擴展架構。

最初,GPU被用來加速AI工作負載。如今,運算儲存設備和資料處理單元(DPU)正逐步應用於資料中心,以提升各種硬體架構的資源利用率。 CPU、GPU以及現在的DPU能夠加速工作負載,減輕傳統處理器的負擔,從而釋放寶貴的CPU資源用於其他關鍵應用。目前,流行的資料中心效能加速器包括多核心處理器、GPU(圖形處理單元)、計算儲存設備和DPU(資料處理單元),它們協同工作,以提高效能並消除不必要的瓶頸。

通用型高效能處理器:X86 多核心處理器

多核心處理器在資料中心非常普及,因為資料中心伺服器CPU的核心越多,每個週期可以執行的程式指令就越多。因此,大多數資料中心伺服器都配備了多核心CPU,透過為企業應用程式提供更強大的CPU處理能力來提升伺服器效能。

深度學習與機器學習:GPU(圖形處理單元)

GPU在資料中心中作為效能加速器非常受歡迎,因為它們非常適合執行人工智慧工作負載,例如機器學習和深度學習訓練。這是因為GPU配備了數千個核心,能夠並行執行大量運算,從而顯著縮短完成複雜工作負載所需的時間。

運算型 NAND 快閃記憶體儲存:極速 NVMe

高效能伺服器可以配置運算儲存設備,透過將資料處理從伺服器的 CPU 卸載到儲存設備來加速儲存功能,而無需依賴主機 CPU 資源。這得益於儲存層內建的處理和記憶體技術,使伺服器能夠以超低延遲即時處理資料。

更智慧的網路卡:DPU(資料處理單元)

資料處理單元 (DPU) 正在逐漸被資料中心伺服器所採用,因為它們能夠將儲存、網路和安全功能從主機伺服器的 CPU 卸載到 DPU,從而釋放 CPU 週期來運行企業應用程式和作業系統。


推動發展趨勢,需要新的解決方案

問題:資料中心中 CPU 資源被浪費,用於管理其他關鍵資料處理和存儲,造成瓶頸。

解決方案:智慧網卡、FPGA、GPU,以及現在的DPU正在塑造新的硬體架構,以實現驚人的效能和超低延遲。

5G 和 PCIe Gen 4 帶來的資料量快速成長,使得邊緣運算成為處理大量資料的必要手段。一些專用的附加卡,例如 SmartNIC FPGA 和 DPU,能夠專注於處理網路任務,從而減輕 CPU 的工作負載,使其能夠更好地用於處理通用工作負載。歡迎收聽 Premio 的 Rugged Edge Survival Podcast,以了解 DPU 的優點。


這些[DPU]將成為未來運算的三大支柱之一。 CPU用於通用運算,GPU用於加速運算,而DPU則負責在資料中心內傳輸數據,進行資料處理。

英偉達執行長黃仁勳


什麼是基於DPU(資料處理單元)的智慧網卡?

資料處理單元 (DPU) 是一種新型可程式處理器,通常與高效能網路介面整合在一起。透過將主機伺服器 CPU 處理網路資料的任務直接交給 DPU,可以釋放寶貴的 CPU 資源,用於管理資料中心中的其他關鍵任務應用程式。例如,DPU 經過最佳化,可以直接在網路介面卡上加速網路、儲存和安全管理功能。

DPU 可以釋放主機 CPU 30% 到 50% 的使用率

DPU 可作為智慧網路卡,用於有效率地控制資料管理和工作負載。

DPU 可以繞過 CPU,直接解析深度學習應用中 GPU 加速所需的資料。

支持 PCIe Gen 4

DPU 支援 PCIe 4.0 外圍元件互連高速介面 (PCIe),這是將高階加速器連接到伺服器的標準介面。

了解更多

  • DPU由以下幾個主要組件構成:
  • 高效能、軟體可編程的多核心ARM處理器,與其他SoC元件緊密耦合

  • 一種高效能網路接口,使DPU能夠解析、處理資料並有效率地透過網路傳輸資料。

  • 一套豐富的、靈活且可編程的加速引擎,可將網路、儲存、安全性和 AI 工作負載從伺服器的 CPU 卸載到 DPU。

DPU 特性

資料安全

100GbE 至 200GbE 的高速網路連接

無需CPU的高速資料包處理

強大的多核心處理器

性能加速器

資料和本地儲存管理

為什麼DPU對資料中心和邊緣運算基礎設施至關重要?

DPU(分散式處理單元)對於資料中心和邊緣網路至關重要,因為它們可以釋放寶貴的伺服器 CPU 資源,用於其他通用處理。 DPU 智慧網卡還可以透過管理資料包來緩解特定的網路瓶頸,而無需與伺服器主機 CPU 進行任何互動。許多新型邊緣運算應用也需要強大的硬體加速來處理傳入數據,以進行即時機器學習和深度學習演算法的訓練。

網路虛擬化

與 x86 CPU 相比,它能更有效率地支援網路虛擬化。它可以將網路工作負載從 CPU 卸載,例如 SRIOV、vFirewall、OVS 和 overlay 網路流量封裝。

資料包控制

透過限制出站資料包,確保網路流量穩定,同時保持相同的吞吐量和質量,從而實現更流暢的內容交付。

提升 5G 流量路由效能

支援虛擬無線存取網 (vRAN)、前傳 I/O、前向糾錯、精確時間戳、eCPRI 視窗化和即時傳輸硬體加速

值得信賴的智慧網卡、FPGA 和 DPU 合作夥伴

NVIDIA 提供 NVIDIA Mellanox BlueField 2 資料處理單元 (DPU),它將業界領先的 ConnectX 網路適配器、強大的多核心處理器和許多其他效能加速器整合到一個可重新編程的封裝中,使組織能夠重新編程該裝置以運行最新的演算法。

了解更多

賽靈思 (Xilinx) 提供基於 FPGA 的 Alveo 系列智慧網卡,可實現硬體加速並避免不必要的資料傳輸。賽靈思 Alveo 能夠加速運算密集型應用,包括機器學習推理、數據分析、視訊轉碼以及許多其他工作負載。

了解更多

為什麼選擇 Premio 作為 DPU 加速伺服器?

在關鍵企業市場的伺服器硬體設計、工程和製造 (ODM) 方面擁有專業知識

  • 專為高效能運算、橫向擴展資料儲存、機器學習和深度學習、公有雲和私有雲管理等工作負載而打造的伺服器產品
  • 在伺服器和儲存架構方面擁有超過 30 年的豐富設計經驗,專注於效能、儲存和高速連接。
  • 在美國建立全球交鑰匙製造和支援基礎設施,以加速伺服器和儲存解決方案的可擴展大規模部署。
  • 深入了解高效能工作負載的物聯網和資料中心技術,包括運算、儲存和連接。
  • 北美市場伺服器和儲存解決方案的監管測試和合規性選項

常見問題

就像 GPU 用於將數學密集型任務從 CPU 卸載到 GPU 一樣,DPU(資料處理單元)用於將網路和儲存功能從 CPU 卸載到 DPU,從而釋放寶貴的 CPU 資源,使其免於處理繁瑣的網路和儲存功能。

可以將CPU視為電腦的大腦,專門處理通用計算。 GPU在資料中心佔有一席之地,因為它們能夠加速某些工作負載,例如人工智慧的深度學習,這得益於它們提供的平行運算能力。 DPU(分散式處理單元)現在也逐漸進入資料中心,因為它們無需佔用主機CPU資源即可處理和解析關鍵任務數據,從而節省時間並降低延遲。

並非所有伺服器都配置了DPU。事實上,由於對伺服器執行的網路和儲存功能的加速需求日益增長,資料中心現在正在引入DPU加速伺服器。根據工作負載和應用的不同,DPU可以為現代資料中心基礎架構帶來巨大的優勢。

配備 DPU 的伺服器的主要優勢在於,它們能夠將資料解析、資料處理和資料傳輸從主機伺服器的 CPU 卸載到 GPU,從而釋放 CPU 資源用於各種企業應用程式。

DPU 配備了強大的多核心處理器和加速引擎,非常適合人工智慧、機器學習、安全、電信、儲存以及許多其他現代資料中心應用。