MSP-SPEECH-RECOGNIZER

音声認識ライブラリ

MSP-SPEECH-RECOGNIZER

概要

音声認識ライブラリは、組込みプロセッサをターゲットとする、話者依存型の固定小数点の音声認識機能を実装しています。このライブラリは、音声対応アプリケーション向けの使いやすい API を公開しています。このライブラリ以外のリソースとして、MinHMM の使用方法を示すサンプルプロジェクトが付属しています。

話者依存型の音声認識機能を使用する前に、認識機能をトレーニングする目的で、話者が各フレーズを複数回話すように開発ユーザーが手順を設定する必要があります。認識機能はトレーニング段階で各フレーズのモデルを作成し、その後、認識プロセスの段階でこれらのモデルを使用することになります。したがって、認識機能の性能は、トレーニングの目的で各フレーズを発音した話者固有の特性になります。仮に別の話者がこの認識機能を使用しようとすると、フレーズの話し方が違うことが原因で、性能が低下する可能性があります。

機能

音声認識ライブラリソフトウェアは、さまざまな組込みアプリケーションに適した、話者依存型の音声認識機能に対応する包括的な API セットを公開しています。音声認識 API を使用すると、アプリケーションで以下の動作を実現できます。

話者が定義するフレーズモデルを作成
性能向上のため、付加的なオーディオデータを使用したフレーズモデルのトレーニング
モデルを削除
認識サーチ中の特定モデルの有効化または無効化
モデルに関する情報の取得
認識検索機能を実行
認識性能をチューニングするパラメータを設定。
オプションで、ファイルに対してモデルデータを読み書きする機能

ダウンロード字幕付きのビデオを表示ビデオ

ダウンロード

ドライバまたはライブラリ

MSP-SPEECH-RECOGNIZER — 音声認識装置ライブラリ

サポート対象の製品とハードウェア

ドーター・カード

BOOSTXL-AUDIO — オーディオ信号処理ブースタパック・プラグイン・モジュール

開発キット

BOOSTXL-K350QVG-S1 — Kentec QVGA ディスプレイ・ブースタパック

MSP-SPEECH-RECOGNIZER — 音声認識装置ライブラリ

ドーター・カード

BOOSTXL-AUDIO — オーディオ信号処理ブースタパック・プラグイン・モジュール

開発キット

BOOSTXL-K350QVG-S1 — Kentec QVGA ディスプレイ・ブースタパック

サポートとトレーニング

TI E2E™ フォーラムでは、TI のエンジニアからの技術サポートを提供

英語で投稿されたすべてのフォーラムトピックを表示

コンテンツは、TI 投稿者やコミュニティ投稿者によって「現状のまま」提供されるもので、TI による仕様の追加を意図するものではありません。使用条件をご確認ください。

TI 製品の品質、パッケージ、ご注文に関するお問い合わせは、TI サポートをご覧ください。

ビデオシリーズ

ビデオをすべて表示

MSP-SPEECH-RECOGNIZER

音声認識ライブラリ