ドライバまたはライブラリ
MSP-SPEECH-RECOGNIZER
音声認識ライブラリ
MSP-SPEECH-RECOGNIZER
概要
音声認識ライブラリは、組込みプロセッサをターゲットとする、話者依存型の固定小数点の音声認識機能を実装しています。このライブラリは、音声対応アプリケーション向けの使いやすい API を公開しています。このライブラリ以外のリソースとして、MinHMM の使用方法を示すサンプル プロジェクトが付属しています。
話者依存型の音声認識機能を使用する前に、認識機能をトレーニングする目的で、話者が各フレーズを複数回話すように開発ユーザーが手順を設定する必要があります。認識機能はトレーニング段階で各フレーズのモデルを作成し、その後、認識プロセスの段階でこれらのモデルを使用することになります。したがって、認識機能の性能は、トレーニングの目的で各フレーズを発音した話者固有の特性になります。仮に別の話者がこの認識機能を使用しようとすると、フレーズの話し方が違うことが原因で、性能が低下する可能性があります。
機能
音声認識ライブラリ ソフトウェアは、さまざまな組込みアプリケーションに適した、話者依存型の音声認識機能に対応する包括的な API セットを公開しています。音声認識 API を使用すると、アプリケーションで以下の動作を実現できます。
- 話者が定義するフレーズ モデルを作成
- 性能向上のため、付加的なオーディオ データを使用したフレーズ モデルのトレーニング
- モデルを削除
- 認識サーチ中の特定モデルの有効化または無効化
- モデルに関する情報の取得
- 認識検索機能を実行
- 認識性能をチューニングするパラメータを設定。
- オプションで、ファイルに対してモデル データを読み書きする機能