学術交流資金報告書2006年度

研究課題名 斜め聞きシステムの精度向上とシステム評価法の確立

代表者氏名  石崎 俊
代表者所属  政策・メディア研究科/教授 

研究分担者 鳥原信一(政策・メディア研究科博士課程3年)  

         中村美代子(SFC研究所上席所員(訪問)) 

       植田那美(SFC研究所上席所員(訪問))                                                                              野本済央(政策・メディア研究科修士課程2年)                                                                                               

平川雅恵(政策・メディア研究科修士課程2年) 

和田拓也(政策・メディア研究科修士課程1年)

三品知子(環境情報学部4)

 

研究の概要 
WEBなどにおける文書を視覚障害者が効率良く読んで内容を的確に把握するために、青眼者が斜め読みするのと同様の機能を英語および日本語音声合成システムで実現し、実用的なシステムの構築を目指す.昨年度にこの斜め聞きシステムの基本部分の構築と若干の改良、聴取実験の基礎部分を行なっている.今年度は研究成果を国際会議で発表し、高度化のためのシステムの精度向上と英語ネイティブに対するシステム評価実験の改良と実施を行った.具体的には、6月にオーストリア・リンツで行なわれた10th International Conference(ICCHP 2006)で本研究の成果を発表した.評価実験では、米国ピッツバーグにおける視覚障害者組織のVIPACE(Visually Impaired Pittsburgh Area Computer enthusiasts)を訪問して、視覚障害者を中心とした英語ネイティブによる本システムの聴取実験を行い、本システムの有効性および評価法の適切性を示す実験データを得ることができた.

研究の背景
障害者用のコンピュータシステムは、障害の種類や程度に合わせて個別に構築し調整する必要があるため、廉価で使いやすいシステムを障害者に供給することは難しい課題である.また、そのようなシステムの構築には障害者の参加や意見の受け入れが不可欠である.視覚障害者のために役立つ補助器具やシステムには多くの種類があり実用化されているが、IT技術が進んだ今日では、電子メールによる情報交換やWEBを用いた情報検索を使いこなすことが基本的な機能として重要であり、もし、これが不十分の場合はデジタルデバイドの対象となる可能性が高い.
 本研究課題である「斜め聞きシステムの構築」はコンピュータシステム上の電子テキストを高速で読み上げるための音声合成システムであり、電子メールやWEBからの検索テキストなどが特に長文の場合に、短時間に効率的に内容を把握できる便利なシステムとなっている.このようなシステムでは、発声スピードを単に高速にするのでは不十分で、かえって理解が難しくなり聞き取り難くなる.従ってテキストに含まれる文章の重要な語を強調した発声のメカニズムが必要であり、従来の音声合成システムには見られなかったものである.
 本研究組織の中心メンバーである鳥原信一君は視覚障害者であって、しかも長期にわたって日本IBMの研究所に勤務していたIT技術者でもある.鳥原君が開発を進めている「斜め聞き基本システム」は上記のような多くの要因を背景として生まれたもので、本資金によって改良を行ない完成を目指している.

研究目的
視覚障害者のための英語音声合成システム「斜め聞き基本システム」において、読み上げる文書の重要語の抽出と発声スピードの制御に関して、英語ネイティブによる聴取実験を行うことによって得られたデータを用いて最適なパラメータの数値を決定し、同時に、米国、英国やカナダの研究者との共同研究の実施、および英語ネイティブの視覚障害者などにとって最適な認知的なインタフェースの実現を目的とする.

斜め聞きシステムの内容
斜め聞き基本システムは英語文書を入力としており、英文中の単語の発声スピードを可変にして制御するメカニズムを持つ.
文書の発声スピードの制御では、重要な語の発声スピードは比較的ゆっくりとし、重要でない語の発声時間をかなり短くすることによって全体の発声時間の短縮を図る.語の重要度の計算と、被験者の聴取能力に応じた発声スピードの決定が課題である.
 語の重要度は、主語の名詞、目的語の名詞、動詞の他に、重要な助動詞、重要な助詞などに優先的に割り当てることが可能である.これらは構文的な情報として与えられる.また、あらかじめ対象領域における重要語の指定が可能であり、これは意味的な重要度ということが出来る.次の段階の重要度としては、文章中における新旧情報がある.新情報は初出なので聞き取り難いためゆっくりと発声し、旧情報は既に知っているので早く発声しても聞き取れる.このような重要度の原理と実際の発声スピードを対応させ斜め聞きの効果を上げるには、個人ごとに異なる英語ネイティブの聴取能力に応じたスピードを抽出し、それに基づいて単語ごとの発声スピードを制御する必要がある. 

実験の内容
英語の斜め聞きシステムを用いて有効性を検証するために、3種類の適切な長さのパッセージと、聞き取れたかどうかをチェックする問題文を作成した.次に、今年度、米国の視覚障害者団体で実験を実施するために、3種類のスピードの合成音声を作成した.一つは基準スピード、二つ目は主な単語のスピードはゆっくりとし、その他の重要でない語のスピードを速める方式、三つ目は二つ目の音声合成と全体の発話時間を同じとし、全体として一律に早い方式の音声合成とした.被験者内要因により統制し,各被験者にはパッセージ毎に3種のスピードをランダムに割り当て提示して比較した.評価実験に用いられる問題文,及び教示はコンピュータによる聴覚提示とし,SFCの日英バイリンガル者に朗読を依頼,録音し聴覚提示用のデータを作成した.本年度は、実験に用いるパッセージの内容をより理解し易いものとし,それに対する問題も真偽を問う平易なものにしたり,問題に対する回答の選択肢を減らすなど,当該システムの評価を更に適正にできるよう工夫した
 実験材料となるパッセージ提示の基準スピードや高速時の速度の最適性は被験者によって違うことが,昨年度の実験よりわかったので,DiGiVoという発声スピード可変装置を用いて、被験者自らが発声スピードを変えながら最高聴取スピードを計測した。斜め聞きシステムでは文中の重要部を低速に発声するが、そのスピードとして測定した最高聴取スピードを用いて、高速部分はその4倍速として合成した。このように被験者ごとに異なった提示スピードを適用して評価実験を実施した.                                      
 具体的には2006年7月25日から7月31日米国ピッツバーグにMike Gravitt氏をVIPACE(Visually Impaired Pittsburgh Area Computer enthusiasts!)に尋ねて、予め集めてもらった視覚障害者を対象に聴取実験を行った。このような海外での実験で英語ネイティブを対象として得たデータ分析した結果、斜め聞きシステムの有効性を統計的にも明確にすることが可能になった.今後はこれらのデータに基づいて斜め聞きシステムの改良をさらに行い、視覚障害者にとって実用的なシステムを構築し、障害者のデジタルデバイドを解消することにつなげたい.日常的な電子メールメールやWEB検索文書だけでなく、とくに、米国や欧州には大量の電子化英文データが整備されており安価で手に入れることが可能であるため、本システムを使用すれば、それらすべての情報を効率よく把握し利用することが出来るようになるので、視覚障害者の基本的な能力の格段の向上が見込める.
 また、このような英語用のシステムの開発を通じて、日本語の斜め聞きシステムの構築ためのノウハウが得られており、日本語用のシステム開発も行なっていて良い見通しを得ている。