研究のまとめ

本研究では、ウェーブレットネットワークを拡張して多層モデルの構築を行い、日本語音声認識に応用した。従来、ウェーブレットネットワークはその多くが単層で関数近似問題を解くのに用いられており、モデルとして拡張が行われてこなかったが、本研究ではその拡張に成功し、複雑なパターン認識の1つである音声認識に適用した。これまでのウェーブレット解析ではシフト不変性の悪影響から逃れられず、また逃れられた場合も計算量の肥大化は避けられなかった。これに対し、本研究で提案したモデルではTime-Delay Neural Networkの構造をベースに多層ウェーブレットネットワークを構築することでシフト不変性の影響を最低限に抑え、同時に認識に必要な計算量も大幅に削減した。汎化精度も従来のTime-Delay Neural Networkを上回っており、提案モデルの有効性を示すことができたと言える。



root 2010-02-26