音声付ルビ・アノテーションの研究
慶應義塾大学大学院政策・メディア研究科博士課程3年
鳥原 信一
http://www.adaptive-techs.com/
1.研究の要点
Webページに対して、アノテーション・サービスを行っている。日本語の漢字の上にひらがな、ローマ字などのRuby(ルビ,ふりがな)振りというアノテーションを行っている。ルビは視覚による読み方の確認である。これに加えて、Webページを音声で読み上げることにした。これはいわば、聴覚による発音の確認となる。日本語を、視覚と聴覚というマルチメディア、マルチモダルによって理解が進むようになる。
2.従来の技術とその問題点
(1) ルビ・音声同時提示がなされていない。
Webサービスとして、ルビを付与するもの、Webページを音声化するものはそれぞれ別々に存在している。したがって、ルビと音声を同時に提示するWebサービスは存在しない。
(2) PCに音声合成エンジンをあらかじめインストールしておく必要がある。
従来、Webページを音声化する場合には、あらかじめ日本語などの音声合成エンジンをインストールしておく必要があった。したがって、いつでも・どこでものユビキタスは達成できなかった。
3.本研究の問題解決手法
前節問題点(1)に対しては、本研究で開発したMedeia Transcoderにより、ルビ・音声同時提示を実現した。ルビは、奈良先端技術大学院大学のChaSenを用いている。日本語音声合成エンジンには、IBMのProTalkerなどを用いている。この2つの形態素解析から得られる読みが異なる場合には、ルビのものに合わせるようにすることが最も重要な設計上の要点であった。
前節問題点(2)に対しては、すべてサーバーサイド・プログラムで実現した。これにより、特別なソフトウェアをインストールすることなく(標準搭載のMedia Playerなどで再生が行われる)。これによりいつでも・どこでものユビキタス性が確保できた。
4.本研究に対する社会的評価
Ruby(ルビ,ふりがな)振りサービスは社会貢献活動として無料で行っている。
数多くの新聞でとりあげられている。
http://www.adaptive-techs.com/
「PRINT ZOOM」2004年3月号(日本印刷新聞社)にも特集されている。
http://www.adaptive-techs.com/pdf/printzoom0403.pdf
「点字ジャーナル」2005年2月号(東京ヘレンケラー協会)にも同様に掲載されている。
http://www.adaptive-techs.com/pdf/tenji-j0502.pdf