今後の課題

本研究を更に進めるにあたり、大別して3つの方向性が考えられる。(1)連続音声認識システムの構築、(2)画像認識への応用である。(1)については提案モデルを大規模化し、集合学習を取り入れて全音素に対応する方法が考えられる。しかし、全音素の特定話者連続音声認識では本研究でも参照したTime-Delay Neural Networkの研究で既に96%の認識率が達成されており、システムとしてそれ以上を目指すことは非常に困難で、既に完結した研究テーマだとさえ言えるかもしれない。次に(2)についてだが、画像処理に関するウェーブレット解析の研究は非常に進んでおり、多くの理論が既に蓄積されている。そしてその多くはウェーブレット係数を用いたパターンマッチングとウェーブレット縮退、方位選択性の利用に端を発するもので、特にパターンマッチングと方位選択性の利用では本研究のようなニューラルネットワークに基礎を置く研究にとって非常に興味深いテーマだろう。また本研究で扱ったテーマは音声認識のみであり、通常``パターン認識''というときはこれに画像認識も含まれる。多層化ウェーブレットネットワークをパターン認識システムと捉えて研究を進めるためには本研究だけでは不十分だ。またウェーブレット理論は画像処理にも広く応用されている。ネットワークモデルの汎化性能を向上させるために重みの学習に何らかの制約を加えることがニューラルネットワーク研究で散見されるが、例えばウェーブレットフレームをモデル内部に構成するような制約を付加すれば画像認識(画像処理)モデルとしてうまく適応できるかもしれない。今後は、そういった画像のパターン認識の方向へ、本研究の先を向けていきたい。


root 2010-02-26