PAGE TOP

 OpenRTC-aist »

   
Home Task Navi HRI REST_API
コミュニケーション知能モジュールパッケージ OpenHRI >> JuliusRTC (音声認識RTC)

JuliusRTC (音声認識RTC)

概要

Juliusは、音声認識システムの開発・研究のためのオープンソースの高性能な汎用大語彙連続音声認識エンジンです。 本コンポーネントは、受け取った音声データをJuliusを用いて音声認識して認識テキストに変換します。
音声認識の方法として、予め認識させる文法を自分で定義してその文法のみを認識する方法と数万語彙の辞書をベースに音声認識を行わせる大語彙音声認識といわれる方法があります。
Julius では、このどちらの方法で利用可能になっています。
本コンポーネントでも、どちらの方法でも利用可能になる改修を行っています。
本コンポーネントは、OpenHRIVoiceパッケージに含まれます。

JuliusRtc data (TimeOctetSeq) activegrammer (TimeString) status (TimeString) result (TimeString) log (TimeOctetSeq)

動作確認OS

  • Ubuntu Linux 16.04以上を推奨
  • Windows 7以上(Windows10を推奨)

依存ライブラリ

  • OpenRTM-aist : OpenRTM-aist-1.1.2-RELEASE(Python)
  • Julius : バージョン4.4.2以上を推奨(バージョン4.4.2以前での動作未確認)

データポート

No Data Ports.

コンフィグレーション

名前データ型デフォルト値設定範囲説明
phonemodel stringmale male,female
音声認識器で利用する音響モデルを設定(現在は、男性用のみ選択可)
voiceactivitydetection stringinternal internal
音声活動のトリガーを設定(現在は、internalのみ選択可)
language stringjapanese japanese,english,german
音声認識する言語を設定
jconf_file stringmain.jconf 限定なし
Julius起動時の設定ファイル(入力デバイスも設定可能)

使用方法

本コンポーネントは、音声認識文法を指定する方法(文法音声認識モード)と文法指定なしの大語彙音声認識モードのどちらかを実行することができます。
JuliusRTCは、通常、.grxmlという識別子を持つ文法ファイルを引数を与えて起動させます。ただし、引数を 'dictation' とすると大語彙音声認識モードで起動します。
Usage: JuliusRTC [-g] [-D] <grxmlファイル名 or dictation>
また、JuliusRTCは、起動オプションとして、'-g' と '-D'をとることができます。
  • '-g'オプションは、起動時に grxmlファイルを選択するためのファイルダイアログを表示します。
  • '-D'オプションは、大語彙音声認識モードで起動します。('dictation'を引数として指定した時と同じ)

設定ファイル

以前のJuliusRTCでは、juliusの本体や音響モデル等のインストール場所やファイル名などは固定としていましたが、今回のバージョンアップで、rtc.conf内でいくつかのカスタマイズができるようになっています。
デフォルトでインストールされたrtc.confでは、JuliusRTCの設定は、julius.confというファイルで設定可能です。
設定可能な項目は、下記のようになっています。
julius.runkit_dir
Julius dictation-kit のインストール場所
julius.voxforge_dir
 英語用音響モデル(Voxforge版音響モデル)のインストール場所

その他

JuliusRTCにクライアントモードを追加しています。(バイナリ版は未対応)クライアントモードでは、Juliusを別途モジュールモードで起動しておき、RTCがアクティベート時に接続して音声認識をすることができます。JuliusRTC内でサブプロセス化していませんので、バージョンアップには便利だと思います。

また、JuliusのDNNのディクテーションモードでクラウドサーバー化できるようになりました。拙作のPyWebSockに機能を実装しています。ただし、PyWebSockは、開発目的が別のところにありましたので、将来的に分離される可能性がありますし、詳細なドキュメント整備ができていません。
興味がある方は、連絡してください。

使用例


資料