修士論文2009年度(平成21年度)






多層化ウェーブレットネットワークを用いた音声認識システムの研究































慶応義塾大学大学院政策・メディア研究科


荒井 悠太

修士論文2009年度(平成21年度)




多層化ウェーブレットネットワークを用いた音声認識システムの研究






論文要旨

これまでパターン認識についての研究が殆ど行われてこなかったウェーブレットネットワークについて、多層化モデルへの拡張によるパターン認識への適用を行う。また、ウェーブレット解析の特徴として入力の時間シフトに結果が大きく影響されるシフト不変性が信号処理に深刻な影響を与えていたが、この問題を解決するためにTime-Delay Neural Networkの学習モデルを利用する。ネットワークの基底関数にウェーブレットを利用することで計算がより複雑にはなるが、コンパクトサポートの構造を利用することで計算処理を抑えることができる。また、ウェーブレットの線形結合で任意の関数を構成できることからシグモイド関数を用いて行うよりも複雑な入出力パターンのモデリングを行うことができ、学習回数そのものを減らすことも期待できる。この多層化モデルを音声のパターン認識モデルとして応用する。提案モデルの有用性を示すために日本語母音の分類実験を行い、従来のネットワークモデルと汎化性能を比較する。


キーワード
多層ウェーブレットネットワーク、音声パターン認識、ニューラルネットワーク、Time-Delay Neural Network






慶応義塾大学大学院政策・メディア研究科
荒井 悠太

Abstract of Master's Thesis Academic Year 2009


The Study of Speech Recognition System Using Multi-layered Wavelet Network






Summary

In this study, Wavelet Networks are extended to multi-layered model for pattern recognition tasks, although few studies have applied them to the tasks. A learning model of Time-Delay Neural Network is adopted in order to solve the problem of shift invariance as a characteristic of wavelet transform affecting seriously on signal processing tasks in which the result is influenced by the input timing shift. Compact support structure of wavelet allows the amount of processing load of calculating wavelet coefficients to be reduced, while using wavelet as a basis function makes the calculation more complicated. More complex modeling of input-output pattern is available than classical sigmoidal models because the linear combination can form any functions, which leads to reducing the iterations. I apply this multi-layered model to the speech recognition model. I compare generalization capabilities of the proposed model with the classical network model by carrying out experiments on Japanese vowels recognition in order to examine the validity of the proposed model.


Key Word
Multi-layered Wavelet Networks, Pattern Recognition of Speech, Neural Network, Time-Delay Neural Network






Keio University Graduate School of Media and Governance
Yuta Arai



root 2010-02-26