摘要本白皮書將說明打造高效邊緣人工智慧 (AI) 系統的要求,以及視覺 AI 處理器如何藉由異質架構和可擴充 AI 性能,幫助實現最佳性能。
![]() | 定義頂尖邊緣人工智慧。許多類型的系統都可從邊緣 AI 處理中獲益。 |
![]() | 什麼是實際的邊緣 AI 系統?考慮哪些架構和核心最適合完成系統所需工作。 |
![]() | 設計搭載視覺 AI 處理器的邊緣 AI 系統,如 TDA4 和 AM6xA 晶片系統 (SoC)。這些 SoC 可在低功耗與低系統 BOM 成本下,提供可擴充的輸送量和運算性能。 |
當消費者在線上訂購產品時,自動化可為程序中的每個步驟提高效率,不管是製造原料、提高倉庫生產力還是促進宅配,有時只需要幾小時即可送達客戶家中。若想在自動化方面持續進步,將需要更好的機器感知和智慧和更少錯誤,此時只要將人工智慧 (AI) 引進邊緣裝置即可達成此目標。
若要打造更快速、更聰明且更準確的系統,需要從更多感測器獲得更多資料,並需增加處理能力。但資料及運算增加也會對系統性能及其功耗和成本要求帶來挑戰。若想實現系統最佳化與縮短開發週期時間,必須以較實際的方式來設計邊緣 AI 系統。
邊緣 AI 以本機裝置處理 AI 演算法取代雲端處理,改變以深度神經網路 (DNN) 為主要演算法元件的工業和汽車應用。邊緣 AI 應用需要高速與低功耗處理,以及應用及其工作特有的進階整合,才能在尺寸受限、功率和散熱受限且成本受限的環境中有效運作。圖 1 說明運用邊緣 AI 處理來提升性能和效率的部分應用。例如使用視覺輸入的邊緣 AI 系統可在生產線上以單一攝影機進行品質控制,或以多部攝影機支援汽車或行動機器人的功能安全。
邊緣 AI 系統可協助改善倉庫與工廠效率,讓城市、建築與農業更安全、更有效率,並讓居家與零售環境更加智慧化。讓我們來看看幾個需要高效邊緣 AI 處理的系統:
表 1 列出各種應用程序的系統要求。
ADAS | 機器人 | 智慧型零售 | 機械 視覺 |
邊緣 AI 運算盒 | |
---|---|---|---|---|---|
深度學習加速器 | x | x | x | x | x |
多攝影機影像訊號處理 (ISP) | x | x | x | x | x |
視覺加速器 | x | x | x | x | x |
深度與運動加速器 | x | x | x | x | x |
乙太網路開關 | x | x | x | ||
快捷外設互聯標準 (PCIe) 交換器 | x | x | |||
功能安全 | x | x |
在高效邊緣 AI 系統中,DNN 無法自行運作。高效 AI 系統需要複雜的視覺管線,通常包含單一或多個攝影機影像處理、傳統電腦視覺,甚至需要多個 DNN。有些應用可能還需影片編碼器和解碼器。為處理所有輸入,系統需要高性能運算。此外,系統可能需要強化安全性和功能安全,以增加系統複雜性和成本。
高效邊緣 AI 系統應針對下列項目進行最佳化:
若要打造高效邊緣 AI 系統,設計人員應考慮哪些架構和核心最適合完成系統所需工作。
嵌入式處理器設計選項有同質架構和異質架構兩種類型,通常整合專用處理功能來處理特定工作。您應根據所需的核心類型,評估最符合您邊緣 AI 系統需求的架構。
邊緣 AI 系統的目標是在最適合的核心上執行 AI、視覺、視訊和其他工作,讓系統在每瓦性能、每秒每 TOPS 性能、成本、尺寸和重量上都能提供最佳效果。擁有適合任務適合核心的異質架構,對邊緣 AI 系統而言至關重要。
並非所有具異質架構的處理器都採用相同設計。矽晶廠商必須選擇適當的處理功能或程序,並決定要對硬體中這些功能進行加速,或採用可配置或可編程方式處理。廠商也必須注意如何將核心整合到系統中。匯流排架構和記憶體子系統必須能夠在核心間有效率地移動資料。
如果 SoC 的工作加速核心類型不正確,或未有效率管理的核心數量過多,或匯流排基礎架構和記憶體子系統效率不佳,視覺邊緣 AI 系統就無法有效發揮作用。