学術交流資金報告書2004年度

研究課題名 障害者用英語音声情報処理システムの高度化研究

代表者氏名  石崎 俊
代表者所属  政策・メディア研究科/教授 

研究分担者  鳥原信一(政策・メディア研究科博士課程3年)                                      中村美代子(SFC研究所上席所員(訪問))                                         植田那美(SFC研究所上席所員(訪問))                                                                                  野本済央(環境情報学部4年)                                                岩田隆(環境情報学部3年)                                                 和田拓也(環境情報学部3年)        

研究の概要 
WEBなどにおける文書を視覚障害者が効率良く読んで内容を的確に把握するために、健常者が斜め読みするのと同様の機能を英語音声合成システムで実現し、実用的なシステムの構築を目指す.昨年度にこの斜め聞きシステムの基本部分の構築と若干の改良、聴取実験の基礎部分を行なっている。今年度は高度化のためのシステムの改良と英語ネイティブに対する聴取実験の改良と実施を行った.具体的には、かねてから交流のある英国エジンバラ大学を訪問して英語音声合成システムの改良を共同研究し、ロンドンおよびカナダで視覚障害者を中心とした英語ネイティブによる本システムの聴取実験を行い、斜め聞きシステムおよび聴取実験の改良を実現し、本システムの有効性を示す実験データを得ることができた,

研究の背景
障害者用のコンピュータシステムは、障害の種類や程度に合わせて個別に構築し調整する必要があるため、廉価で使いやすいシステムを障害者に供給することは難しい課題である.また、そのようなシステムの構築には障害者の参加や意見の受け入れが不可欠である.
 視覚障害者のために役立つ補助器具やシステムには多くの種類があり実用化されているが、IT技術が進んだ今日では、電子メールによる情報交換やWEBを用いた情報検索を使いこなすことが基本的な機能として重要であり、もし、これが不十分の場合はデジタルデバイドの対象となる可能性が高い.
 本研究課題である「斜め聞きシステムの構築」はコンピュータシステム上の電子テキストを高速で読み上げるための音声合成システムであり、電子メールやWEBからの検索テキストなどが特に長文の場合に、短時間に効率的に内容を把握できる便利なシステムとなっている.
 このようなシステムでは、発声スピードを単に高速にするのでは不十分で、かえって理解が難しくなり聞き取り難くすることになる.テキストに含まれる文章の重要な語を強調した発声のメカニズムが必要であり、従来の音声合成システムには見られなかったものである.
 本研究組織のメンバーである鳥原信一君は視覚障害者であって、しかも長期にわたって日本IBMの研究所に勤務しているIT技術者でもある.鳥原君が開発を進めている「斜め聞き基本システム」は上記のような多くの要因を背景として生まれたもので、本資金によって改良を行ない完成を目指している.

研究目的
視覚障害者のための英語音声合成システム「斜め聞き基本システム」において、読み上げる文書の重要語の抽出と発声スピードの制御に関して、英語ネイティブによる聴取実験を行うことによって得られたデータを用いて最適なパラメータの数値を決定し、同時に、英国やカナダの研究者との共同研究の実施、および英語ネイティブの視覚障害者などにとって最適な認知的なインタフェースの実現を目的とする.

斜め聞きシステムの内容
斜め聞き基本システムは英語文書を入力としており、英文中の単語の発声スピードを可変にして制御するメカニズムを持つ.英語の単語は日本語に比べて子音が多く、音節単位の発声が基本構造になっている.一方、日本語は母音が多くモーラといわれる単位で発声の制御が行われるため、単語における発声スピードの制御は自然さや聞き取りやすさを維持するのが難しい.その意味で、本研究ではまず英語を対象にしたシステムを構築しており、日本語はその次の課題としている.
 文書の発声スピードの制御では、重要な語の発声スピードは比較的ゆっくりとし、重要でない語の発声時間をかなり短くすることによって全体の発声時間の短縮を図る.語の重要度の計算と、被験者の聴取能力に応じた発声スピードの決定が課題である.
 語の重要度は、主語の名詞、目的語の名詞、動詞の他に、重要な助動詞、重要な助詞などに優先的に割り当てることが可能である.これらは構文的な情報として与えられる.また、あらかじめ対象領域における重要語の指定が可能であり、これは意味的な重要度ということが出来る.次の段階の重要度としては、文章中における新旧情報がある.新情報は初出なので聞き取り難いためゆっくりと発声し、旧情報は既に知っているので早く発声しても聞き取れる.
 このような重要度の原理と実際の発声スピードを対応させ斜め聞きの効果を上げるには、個人ごとに異なる英語ネイティブの聴取能力に応じたスピードを抽出し、それに基づいて単語ごとの発声スピードを制御する必要がある. 

実験の内容
英語を用いる斜め聞きシステムを用いて有効性を検証するために、3種類の適切な長さのパッセージと、聞き取れたかどうかをチェックする問題文を作成した.次に、今年度、英国とカナダで実験を実施するために、3種類のスピードの合成音声を作成した.一つは基準スピード、二つ目は主な単語のスピードはゆっくりとし、その他の重要でない語のスピードを速める方式、三つ目は二つ目の音声合成と全体の発話時間を同じとし、全体として一律に早い方式の音声合成とした.実験後には、参考としてSD法による主観評価も行なった.被験者内要因により統制し,各被験者にはパッセージ毎に3種のスピードをランダムに割り当て提示して比較した.評価実験に用いられる問題文,及び教示はコンピュータによる聴覚提示とし,SFCの日英バイリンガル者に朗読を依頼,録音し聴覚提示用のデータを作成した.本年度は新たに評価実験用の言語材料を見直し,理解度確認問題の聴覚提示によることの負担が少ないものに改訂した.より詳細には実験に用いるパッセージの内容をより理解し易いものとし,それに対する問題も真偽を問う平易なものにしたり,問題に対する回答の選択肢を減らすなど,当該システムの評価を更に適正にできるよう工夫した
 実験材料となるパッセージ提示の基準スピードや高速時の速度の最適性は被験者によって違うことが,昨年度の実験よりわかったので,それらの適正スピードを被験者ごとに測るために,実験の前に基本単語リストおよび,語釈文から見出し語を推測する独自の方法を用いて最適スピードを測り,更にそれをパッセージに用いられるスピードに即時に変換できるプログラムをPC上に作成して,被験者ごとに異なった提示スピードを適用して評価実験を実施した.                                      
 具体的には2004年10月には英国エジンバラ大学で英語音声合成システムに関する研究打ち合わせを行い、同大学で開発・公開しているシステムを本プロジェクトに使用するための改良の可能性、斜め聞きシステムに関するコメント、研究上の助言などを得ることができた。ロンドンでは視覚障害者の団体を訪問し、予め集めてもらった視覚障害者と団体職員の健常者を対象に聴取実験を行った。次に2005年3月にはカナダのマニトバ州で視覚障害者の団体を訪問し、ロンドンと同様な実験を実施した.
 このような海外での実験で英語ネイティブを対象として得たデータ分析した結果、斜め聞きシステムの有効性を統計的にも明確にすることが可能になった.今後はこれらのデータに基づいて斜め聞きシステムの改良をさらに行い、視覚障害者にとって実用的なシステムを構築し、障害者のデジタルデバイドを解消することにつなげたい.日常的な電子メールメールやWEB検索文書だけでなく、とくに、米国や欧州には大量の電子化英文データが整備されており安価で手に入れることが可能であるため、本システムを使用すれば、それらすべての情報を効率よく把握し利用することが出来るようになるので、視覚障害者の基本的な能力の格段の向上が見込める.
 また、このような英語用のシステムの開発を通じて、日本語の斜め聞きシステムの構築ためのノウハウが得られ、近い将来に日本語用のシステム開発の見通しが得られる予定である.