次の記事
前の記事

Pi日記 音声認識続編

ひとまずディスク容量にも余裕ができたので続きを行います。
ついでにPiのアップデートも行っておきます。
apt-get update
apt-get upgrade
rpi-update
しばらくやってなかったので大量にアップデートされました。

さて、気を取り直してwgetで取ってきたファイルを展開します。
そしてディクテーションキットの中に移動して実行してみます。
デモ用のプログラムが用意されているのでそれを使います。
julius -C main.jconf -C am-gmm.jconf -demo
いろいろとログが出た後でエラーが出る可能性があります。failed to open /dev/dspのエラーの場合には
sudo sh -c "echo snd-pcm-oss >> /etc/modules"
で何とかなるかもしれません
実行に成功すると、マイクからの入力に対してリアルタイムに文字認識をかけてくれます。
Pi3のCPUではちょっと遅いですが、マイクに話しかけた後1秒ぐらいで認識が完了します。
認識結果は決して良いとは言えませんが、一切学習させていない状態だとそんなもんでしょう。
「お世話になります」 -> お世話になりな
「早口で喋るとダメだ」 -> 早口しゃべるのだ
こんな感じです。固有名詞が認識できないので「株式会社山本山の田中です」とかは絶望的です。
(株)ショナわめくも合流
などというよくわからない会社名に変換されます。
こればっかりは学習させる必要がありそうです。
「株式会社シルクロードの田中です」 -> (株)昼ごろ音の田中です。
それでもSkyWayでの日本語認識より随分と賢いです。

juliusは京大とかIPAなどが主催となって開発されたプログラムです。
http://julius.osdn.jp
そのため、日本語の認識が何も手を加えずにおこなえます。
語彙数を絞った辞書を自作すれば動作速度も上がるようなので使いようによってはものになるかもしれません。

単語と文法のそれぞれを鍛えられるので、「お世話になります」辞書を作ったらいけそうなきがする。


コメント