学術交流支援資金報告書2005年度

研究課題名 マルチスピーカーによる視覚障害者用英語音声合成システムの効率化研究

代表者氏名  石崎 俊
代表者所属  政策・メディア研究科/教授 

研究分担者 鳥原信一(政策・メディア研究科博士課程3年)
中村美代子(SFC研究所上席所員(訪問))
植田那美(SFC研究所上席所員(訪問))
野本済央(政策・メディア研究科修士課程1年)
岩田隆(環境情報学部4年)
和田拓也(環境情報学部4年)
        

研究の概要

WEBなどにおける文書を視覚障害者が効率良く読んで内容を的確に把握するために、健常者が斜め読みするのと同様な機能を英語音声合成システムで実現し、実用的なシステムの構築を目指す.昨年度にはこの斜め聞きシステムの基本部分の構築と若干の改良を行って、聴取実験の基礎部分をイギリスおよびカナダで視覚障害者を中心に実施している。今年度は聴取実験の内容を整備・高度化して、カナダのバンクーバー・トリニティカレッジで英語ネイティブの多数の視覚障害者を対象に本システムの聴取実験を行い、本システムの有効性を示す実験データを得ることができた,このような成果はコンピュータに関するアクセッシビリティの国際標準化にも貢献できると考えられる。

研究の背景

障害者用のコンピュータシステムは、障害の種類や程度に合わせて個別に構築し調整する必要があるため、廉価で使いやすいシステムを障害者に供給することは難しい課題である.また、そのようなシステムの構築には障害者の参加や意見の受け入れが不可欠である.
 視覚障害者のために役立つ補助器具やシステムには多くの種類があり実用化されているが、IT技術が進んだ今日では、電子メールによる情報交換やWEBを用いた情報検索を使いこなすことが基本的な機能として重要であり、もし、これが不十分の場合は視覚障害者に対するデジタルデバイドの対象となる可能性が高く、アクセッシビリティの国際標準化でも重要な課題である.
 本研究課題である「斜め聞きシステムの構築」はコンピュータシステムやWEB上の電子テキストを高速で読み上げるための音声合成システムであり、電子メールやWEBからの検索テキストなどが特に長文の場合に、短時間に効率的に内容を把握できる便利なシステムとなっている.このようなシステムでは、発声スピードを単に高速にするのでは不十分で、かえって理解が難しくなり聞き取り難くすることになる.テキストに含まれる文章の重要な語を強調した発声のメカニズムが必要であり、従来の音声合成システムには見られなかったものである.
 本研究組織のメンバーである鳥原信一君は視覚障害者であって、しかも長期にわたって日本IBMの研究所に勤務しているIT技術者でもある.鳥原君が開発を進めている「斜め聞き基本システム」は上記のような多くの要因を背景として生まれたもので、本資金によって改良を行ない完成を目指している.

研究目的

視覚障害者のための英語音声合成システム「斜め聞き基本システム」において、読み上げる文書の重要語の抽出と発声スピードの制御に関して、英語ネイティブによる聴取実験を行うことによって得られたデータを用いて最適なパラメータの数値を決定し、英語ネイティブの視覚障害者などにとって最適な認知的インタフェースの実現を目的とする.今年度は特に名詞や動詞などの他に叙述形容詞や数詞などを重要語としたときの実験や、新旧情報における重要度の違いについても実験を行ない高度化を図る。また,日本語や中国語についても音声合成の高速化と聴取実験を行なって多言語化の準備を行う.

斜め聞きシステムの内容

斜め聞き基本システムは英語文書を入力としており、英文中の単語の発声スピードを可変にして制御するメカニズムを持つ.英語の単語は日本語に比べて子音が多く、音節単位の発声が基本構造になっている.文書の発声スピードの制御では、重要な語の発声スピードは比較的ゆっくりとし、重要でない語の発声時間をかなり短くすることによって全体の発声時間の短縮を図る.語の重要度の計算と、被験者の聴取能力に応じた発声スピードの決定が課題である.
 語の重要度は、主語の名詞、目的語の名詞、動詞の他に、叙述形容詞や数詞などが文中で重要な場合が多く、それらを優先的に割り当てることが可能である.これらは構文的な情報として与えられる.また、あらかじめ対象領域における重要語の指定が可能であり、これは意味的な重要度ということが出来る.次の段階の重要度としては、文章中における新旧情報がある.新情報は初出なので聞き取り難いためゆっくりと発声し、旧情報は既に知っているので早く発声しても聞き取れる.
 このような重要度の原理と実際の発声スピードを対応させ斜め聞きの効果を上げるには、個人ごとに異なる英語ネイティブの聴取能力に応じたスピードを抽出し、それに基づいて単語ごとの発声スピードを制御する必要がある. 

実験の内容

英語を用いる斜め聞きシステムを用いて有効性を検証するために、4種類の適切な長さのパッセージと、聞き取れたかどうかをチェックする問題文を作成した.それらは、茶道、キムチ、ハーブティ、お祭りなどをテーマにする4つの平易なパッセージである。被験者はカナダのバンクーバートリニティカレッジの学生を中心に合計で29名であったが、音声合成システムへの慣れなどから成績上位者の20名を対象に分析を行った。4つのパッセージごとに、基準スピード、斜め聴き用のスピード制御、三つ目は斜め聞き音声合成と全体の発話時間を同じとし、全体として一律に早い方式の音声合成とした.被験者内要因により統制し,各被験者にはパッセージ毎に3種のスピードをランダムに割り当て提示して比較した.評価実験に用いられる問題文,及び教示はコンピュータによる聴覚提示とし,SFCの日英バイリンガル者に朗読を依頼,録音し聴覚提示用のデータを作成した.
 実験材料となるパッセージ提示の基準スピードや高速時の速度の最適性は被験者によって違うので,それらの適正スピードを被験者ごとに測るために,実験の前に基本単語リストおよび,語釈文から見出し語を推測する独自の方法を用いて最適スピードを測り,更にそれをパッセージに用いられるスピードに即時に変換できるプログラムをPC上に作成して,被験者ごとに異なった提示スピードを適用して評価実験を実施した.                                      
 このような海外での実験で英語ネイティブを対象として得たデータ分析した結果、斜め聞きシステムの有効性を統計的にも明確にする見通しが得られた.今後はこれらのデータに基づいて斜め聞きシステムの改良をさらに行い、視覚障害者にとって実用的なシステムを構築し、障害者のデジタルデバイドを解消することにつなげたい.また、障害者からコンピュータへのアクッセシビリティを国際的に標準化する動きが活発であるので、本研究成果を利用したいと考えている.日常的な電子メールメールやWEB検索文書だけでなく、とくに、米国や欧州には大量の電子化英文データが整備されており安価で手に入れることが可能であるため、本システムを使用すれば、それらすべての情報を効率よく把握し利用することが出来るようになるので、視覚障害者の基本的な能力の格段の向上が見込める.
 また、このような英語用のシステムの開発を通じて、日本語や中国語などの斜め聞きシステムの構築ためのノウハウが得られているので、近い将来に多言語を対象にしたシステム開発の見通しが得られる予定である.