JAJY134 ホワイト・ペーパー

JAJY134A january 2022 – march 2023 TDA4VM , TDA4VM-Q1

プログラム可能なコア・タイプとアクセラレータ

エッジ AI システムで使用可能なコア・タイプを確認しましょう。

CPU

中央演算処理装置 (CPU) は、シーケンシャル・ワークロードを処理できる汎用処理装置です。プログラミングの柔軟性が高く、既存の大規模なコード・ベースを利用できます。一般的に、ほとんどのエッジ AI システムは、プラットフォームと機能豊富なアプリケーションを管理するために、2～8 個の CPU コアを搭載しています。ただし、CPU のみのシステムは、ピクセルレベルの画像処理、コンピュータ・ビジョン、畳み込みニューラル・ネットワーク (CNN) 処理など、高度に専門化されたタスクには適していません。また、CPU は消費電力が大きくなりますが、さまざまなコア・タイプの中でスループットが最も低くなります。シングルコア CPU システムと、AI アクセラレーションや画像処理などの専用ハードウェア・ブロックを組み合わせることで、低コスト・アプリケーションの電力バジェットの要件を満たすことができます。

GPU

GPU (グラフィックス・プロセッシング・ユニット) は、並列処理タスクに適した数百から数千個の小さなコアを搭載しています。元々、一連のグラフィック操作を実装するために設計された GPU は、ディープ・ラーニング・アプリケーションで一般的であり、特に DNN のトレーニングに役立ちます。主な欠点の 1 つは、コア数が多いため、GPU は大量の電力を消費し、オンチップ・メモリの要件が高くなることです。

DSP

デジタル・シグナル・プロセッサ (DSP) は、通常、複数の複雑な数学の問題を解決するために設計された、電力効率の高い特殊なコアです。DSP は、現実世界のビジョン、オーディオ、スピーチ、レーダー、ソナーの各センサからのリアルタイム・データを低消費電力で処理します。DSP は、クロック・サイクルあたりの処理を最大化するのに役立ちます。しかし、プログラミングはそれほど簡単ではなく、最高の性能を実現するには、DSP ハードウェアの機能、プログラミング環境、および DSP ソフトウェアの最適化に精通している必要があります。

ASIC

特定用途向け集積回路 (ASIC) とアクセラレータは、システム・アプリケーションのために最小の消費電力で最大の性能を実現します。高速化したい機能のコア・カーネルがわかっている場合には、一般的な選択肢になります。たとえば、CNN のコア計算には常に行列の乗算が含まれます。従来のコンピュータ・ビジョンのタスクでは、専用のハードウェア・アクセラレータを使用して、画像のスケーリング、レンズの歪み補正、ノイズ・フィルタリングなどの演算を実行できます。

FPGA

フィールド・プログラマブル・ゲート・アレイ (FPGA) は、特定のアプリケーション向けにハードウェア・ブロックを再プログラムしてターゲットにすることができる、集積回路の一種です。GPU や CPU よりも消費電力が低くなりますが、ASIC よりも消費電力が大きくなります。ただし、ハードウェアのプログラミングは難しく、Verilog や超高速 IC ハードウェア記述言語など、ハードウェア記述言語に関する専門知識が必要です。