Media Transcoderを用いた障害者支援技術

Ruby(ルビ,ふりがな)振りサービスへの適応―

 

羽川 順子   羽川 和男   鳥原 信一

†アイ・クリエイツ 194-0004 東京都町田市鶴間1058-5

‡慶應義塾大学大学院政策・メディア研究科 252-0816 神奈川県藤沢市遠藤5322

E-mail:  { hagawa-j@kp, hagawa-k@nr }.catv.ne.jp,  torihara@sfc.keio.ac.jp

あらまし  障害者を支援するには,マルチ・メディアを用いて,多彩な様態(modality),複数のチャンネルで情報を提示する必要がある.我々はインターネット上にある情報を障害の種類・特性に適応させるためにMedia Transcoderという枠組みを用いて提示する方式を提案する.さらに,Media Transcoderの適応例として,現在運用中の電子メールやWebページにルビを振るサービスを紹介し,Media Transcoderを用いたRubyアノテーションについて議論する.

キーワード  Media Transcoder,支援技術,ルビ振り,読み書き障害,日本語学習,ユビキタス,アノテーション

Adaptive Technologies by “Media Transcoder”

The Application of Ruby-Setting Service

Junko HAGAWA   Kazuo HAGAWA   and    Shinichi TORIHARA

I-Create Corporation  1058-5 Tsuruma, Machida-shi, Tokyo, 194-0004 Japan
Graduate School of Media and Governance, Keio University  5322 Endo, Fujisawa-shi, Kanagawa, 252-0816 Japan

E-mail:  { hagawa-j@kp, hagawa-k@nr }.catv.ne.jp,  torihara@sfc.keio.ac.jp

Abstract  In supporting the handicappedIt is very important to provide the information with them in the ways of multimedia multiple modalities and multiple channels We will propose "Media Transcoder" to adapt to the kinds and properties of each impaired person in obtaining the information on the Internet We will also introduce our service "Ruby-setting" and discuss the possibilities of "Ruby Annotation" by using Media Transcoder

Keyword  Media TranscoderAdaptive TechnologiesRuby-settingDyslexiaJapanese LearningUbiquityAnnotation


1. はじめに

従来の障害者支援技術は障害の「ある感覚」から「他の感覚」への代行技術であった.例えば視覚障害者に対してはテキストを点字や音声に変換することのみ行なっていた.福祉情報工学の研究が進展するにつれて障害者に情報を提示する際には,障害者の障害の種類および特性などを考慮し,複数のメディア,複数の様態そして複数のチャンネルでの情報提示が必須であることが分かってきている.例えば視覚障害者がテキスト中の情報を得る際に音声・拡大文字・点字など複数の様態を同時に提示することは意味深い.IBMには"Semantic Transcoder" という技術がある[1].この技術はWeb上にある情報を言語的・意味論的メディアおよび複数のメディアへと変換するものである.さらに,メディア変換された情報に対して人間がアノテーションという形で介在することができる.このSemantic Transcoder を障害者支援技術に用いる研究がある[2].しかしながらこの枠組みでの障害者支援技術の実際的利用は実現していない.Web上にある情報を加工処理すると著作権が問題となる.ましてやWebページに人間による注釈・解説が付けられるのであるから著作権者は違法行為と解釈するのは当然であろう.最近の情報法学の研究によると,Web上の情報を処理加工するにはNPO(特定非営利活動法人)のような利益を求めない公益性を図る団体が関与し,動的・一過性的である必要がある.一時ファイルを残したり,人間が介在して修正することは許されない.我々はメディア変換器を縦横に組み合わせることができる"Media Transcoder"という枠組みを開発した.一つのメディアから複数のメディアおよび複数の様態へと変換可能である.人間が介在するアノテーションはpeer to peerないしone on oneに見えるようにシステムの設計を進めている.2章ではMedia Transcoder の概念について述べる.3章ではMedia Transcoderを用いて電子メールおよびWebページにルビ振りするサービスの実際例を紹介する.4章においては従来のルビ振り技術の問題点を考察し,我々のルビ振りサービス技術は拡張性があり優位性があることを示す.5章は"Ruby Annotation"の可能性について議論し,さらに今後の展開方向について触れる.

 

2. Media Transcoderの概念

 

2.1. WebにおけるMedia Transcoder

WebにおけるMedia Transcoderは,ユーザーのWebブラウザとWWWサーバーとの中間に位置するProxy(代行)サーバーとしてAgent機能を行なう.図1にWebにおけるMedia Transcoderの概念図を示す.

 

図1 WebにおけるMedia Transcoderの概念図

 
 

 

 

 

 

 

 

 

 

 

 

 

 

 


Media Transcoderが行なった変換データに対して人間が介在してデータの修正・注釈・解説を行なうことが可能となる.重要なのはこれらのアノテーション作業はhttpプロトコルで行なうのではなく,peer to peerプロトコル(jxtaなど)を用いてユーザーとアノテーターとの一対一,個人的なサポートに見えるようにシステム設計すべきである.

 

2.2. 電子メールにおけるMedia Transcoder

UNIXのメール転送プログラムに"Fetchmail"というのがある.これはPOP3サーバーからメールを取得した後にSMTPサーバーで指定されたメールアドレスにメールを転送するプログラムである.我々のMedia TranscoderPOP3サーバーからのメール取得後に実行され,メディア変換後のメールが指定アドレスに転送される仕組みである.図2に電子メールにおけるMedia Transcoderの概念図を示す.

 

 

 

 

 

 

 

 

 

 

 

 

 

 


2.3. WebMedia Transcoderのサンプル

3WebにおけるMedia Transcoderを用いた構想の一つであるネットワークライブラリーを示す.視覚障害者が書籍の電子テキストを取得するには,出版社と交渉の後,書籍の領収書・身体障害者手帳をファックスなどで出版社に送付する.後にフロッピーディスクまたは電子メールでテキストが送付されてくる.これらの一連の流れをMedia Transcoderの枠組みを用いて実現する.該当の電子テキストが無い場合など人間がネットワークに介在し,処理することが可能である.

 
 

 

 

 

 

 

 

 

 

 

 

3 ネットワークライブラリー

 
 

 

 

2.4. 電子メール版 Media Transcoderのサンプル

看板などの文字認識支援として画像中の文字認識後,翻訳したテキストを画像中に合成する研究がある[3].図4に電子メールにおけるMedia Transcoderを用いた構想の一つを示す.ユーザーはカメラ付き携帯電話で読み方の分からない看板を撮影し,Media Transcoderに向けて送信する.Media Transcoderは文字認識を行ない,画像中の文字情報を取り出す.次に奈良先端科学技術大学院大学の茶筌[4]を用いて漢字かな変換を行なう.さらにふりがなを該当漢字の上に画像処理して合成する.最後にユーザーにメール返信を行なうことで,ユーザーは読めなかった看板が理解できる.

 

 

 

 

 

 

 

 

 

 

 

 

 


3. Media Transcoderの適応例 Ruby(ルビ,ふりがな)振り−

 

3.1. WebMedia Transcoderを用いたルビ振り技術

 

 Webページの漢字にルビ振りし,留学生の学習支援に用いる研究がある[5].我々はWebにおけるMedia Transcoderをルビ振りに適用した.図5にその概念図を示す.Proxyサーバーの位置にMedia Transcoderがある.ユーザーがWebブラウザで閲覧したいWebページのURLを指定するとMedia Transcoderは指定されたWWWサーバーからHTMLドキュメントを取得する. XMLパーサーを用いてHTMLのタグ解析を行ない,ルビ振り対象文字列を取り出す.茶筌によって漢字かな変換を行ない,再び正しいHTML形式に戻す.これをユーザーのブラウザに渡すことにより,該当漢字に対してルビが表示される.

 

 

図5Web版ルビ振り技術の概念図

 
 

 

 

 

 

 

 

 

 

 

 

 


3.2. 電子メール版Media Transcoderを用いたルビ振り技術

メールを転送する際に中間処理としてMedia Transcoderが動作する.図6にその概念図を示す.Media Transcoderはメールヘッダーを解析し,plainテキストあるいはHTMLの形式かを判定し,メール本文のルビ振り対象となる文字列に対して,茶筌によって漢字かな変換を行ない,ルビを付与することができる.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


  7にメールサーバー(POP3SMTPサーバー)

Media Transcoderを内蔵するメール転送プログラム(“MailTransfer”)の関係図を示す.

 

7 メール転送プログラムの流れ

 
 

 

 

 

 


3.3. ルビ表示のためのHTML仕様

 ルビ表示をするためのHTMLにおける仕様と対応ブラウザの状況を表1に示す.また,HTMLタグの実際例を図8に示す.

 

1 HTML仕様とブラウザの対応状況

 
 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


4. ルビ振り従来技術とその問題点および我々の問題解決手法

 

4.1. ルビ振り従来技術とその問題点

 

 従来のルビ振りソフトウェアおよびサーバーサービスは概して携帯性が乏しい.日本における携帯電話の所有台数は6000万台を超えている.いつでもどこでも(ユビキタス)情報にアクセスする必要のある現代においては,当然ながら障害者も適切な形で情報をタイムリーに処理することが望まれる.また,その場所でなければ特定の情報が得られないことがある.例えばバスの行き先,時刻表などである.場所に付着した情報を障害者の特性に応じてメディア変換する必要があるにもかかわらず,従来のルビ振り技術は現状の障害者の抱えている問題に応えていない.表2にルビ振りソフトウェアおよびサーバーサービスとその問題点を列挙する.

 

 

2 従来技術の問題点

 
 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


4.2. Media Transcoderによる問題解決手法および技術の優位性

 従来のルビ振り技術の問題点に対する我々の問題解決手法について述べる.

(1)    操作性

 あらかじめ設定したオプションに従って,奈良先端科学技術大学院大学の茶筌を用いて自動的に漢字にルビを付与している.

(2)    モバイル性

  Media Transcoderはサーバーサイドプログラムによって実現しており,高度な処理がサーバーで行なえるため,PDAや携帯電話に負荷をかけることなくルビを付与することができる.さらに,電子メールにもルビ振りを行なっているので携帯電話などでの電子メールのやりとりの際にも利用でき,いつでもどこでもといったユビキタス環境を実現している.

(3)    単語登録

  ユーザー辞書およびシステム辞書への単語登録機能を有する.ユーザーの単語登録要求のあった単語の中から,全体に反映すべき単語を選択しシステム辞書に登録する.

 

  次にMedia Transcoderを用いた我々のルビ振り技術の優位性について述べる.

(1)    複数のメディア,種々の様態(modality)での情報提示

Media Transcoderは複数のメディア変換器を内蔵し,それを直列または並列に組み合わせることにより様々なメディアおよび様態を生成することが可能である.文字情報の付与だけではなくテキスト音声合成技術によって音声を付与したり,静止画・動画・音声など複数のメディアが同期をとって情報を提示することができる.

(2)    柔軟な機能拡張性

Media Transcoderはサーバーで稼働するプログラムである.そのため携帯型端末や携帯電話に負荷をかけることなく機能拡張ができる.例えば,カメラ付き携帯電話からの画像に対してOCR処理を行ない,画像にルビを付与することもサーバー側の機能拡張だけで実現可能である.

(3)    容易な他言語化

サーバーにあるMedia Transcoderの中に言語翻訳器を加えることにより,日本語のみならずあらゆる言語への対応が可能となる.

 

5. Ruby Annotation

 

5.1. ルビ振りサービス

 インターネットにおける情報を処理加工するには著作権の問題がありNPO(特定非営利活動法人)のような公益に寄与する活動をする団体である必要がある.我々は「アダプティブテクノロジー」という団体を設立し,ルビ振りサービスを開始している[6].我々のルビ振りサービスについてその内容を詳細に述べることにする.

(1)    ルビの表示位置

@    上にルビ  A横にルビ

漢字(かんじ)(うえ)にルビ

漢字[かんじ]の横[よこ]にルビ

(2)    ルビ文字の種類

@    ひらがな Aカタカナ Bローマ字

 平仮名(ひらがな)のルビ 片仮名(カタカナ)のルビ ローマ字(ro-ma ji)のルビ

(3) ルビオプションの種類

 我々のサービスのオプションを表3に示す.種類・対象・書式それぞれ選択可能であり,12通りのルビ振りを用意している.

 

ルビ文字の種類

対象

書式

ひらがな

カタカナ

ローマ字

漢字のみ

 

全文

HTML

 

テキスト

表3 ルビオプションの種類

 

5.2. Ruby Annotationの可能性

 W3C XHTML Ruby Annotation[7]の記述によると,ルビだけではなく多種多様なアノテーションが表現可能となっている.そこで多彩な可能性について検討してみた.表4にルビとしてのメディアを5種類示す.

 

文字

(テキスト)

ふりがな(意味,逐語訳,語源,字源,翻訳文,反意語,類義語,用例,誤用例…),各種コード(Jan,点字,発音記号…)etc.

静止画

説明画像,地図,楽譜,ピクトグラム,点字,SPコード,バーコードetc.

動画

説明画像,手話アニメ,口唇画etc.

音声

音声合成,効果音etc.

リンク

解説情報や検索サイトへのハイパーリンクetc.

表4 ルビ・メディアの種類

3.3で述べた複雑ルビの書式において,各行のルビに5種類のメディアの形式を適用すると,125通り(5×5×5)の情報提示が可能となり,多種多様なメディアをルビとした,マルチモーダルなWebコンテンツへの意味付けが実現できる.次に各メディアをルビ付与した場合の応用例を図9に示す.(1)は「バラ」という文字に対して,漢字・英単語と共に,静止画像で花の画像を付与している.(2)は「あける」という文字に対して漢字とその用例を付与し,さらに用例にはURLのアドレスリンクを貼っている.(3)は新着メールというPC操作用語に対してふりがなと効果音の付与をしたものである.ルビのマルチメディア化を実現することによって多様なサービスが展開できるであろう.

図9各種メディアをルビ付与した例

 

 

 

 

 

5.3. 今後の展開

Media Transcoderはサーバーサイドプログラムであり機能拡張性に富んでいる.また,Media Transcoderには多くのメディア変換器を内蔵し,その組み合わせにも柔軟性があり様々なサービスを様々な形式でサポートすることが可能である.

次に今後展開予定の項目を示す.

(1)    ルビの複数行化と多言語化

10に実現のイメージを示す。

10ルビの複数行化と多言語化

 

 

 

(2)    漢字の難易度指定

小学校の学年別漢字および学年別使用語彙に基づいてルビを付与する漢字レベルを指定できる.

(3)    変換辞書の充実

大規模な人名および地名辞書データベースを入手して茶筌の辞書に追加する.

(4)    文字認識技術の導入

カメラ付き携帯電話などで読みたい漢字を含む画像をMedia Transcoderに送付すると文字認識・画像合成処理などを行ないメールで返信する機能を追加する.図11に文字認識処理の導入時のイメージを載せることにする.

 

 

 

 

 

 

 

 

 

 

 

 

 

 


6. おわりに

 インターネットにおける情報へのアノテーション・サービス,ルビ振りサービスなどでは,著作権の関係から情報を動的・一過性的に処理する必要がある.また,ユーザーのプライバシーを保護するために,完全自動で稼働しなければならない.さらに,ユーザーがアノテーターによるサポートを要求した時はユーザーとアノテーター間での個人的な情報の受け渡しをする仕組みを必要としている.我々はこれらの環境をMedia Transcoderというフレームワークによって実現し,ルビ振りサービスを本格運用している.Media TranscoderWeb版においては,Proxyサーバーの位置にあり,メール版ではメール転送プログラム中のPOP3サーバーおよびSMTPサーバーを呼び出す中間に位置している.Media Transcoderには多くのメディア変換器を内蔵し,またさらなるメディア変換器の追加も容易である.従来の感覚代行という観点から,単一メディアへの変換だけでは障害者を充分に支援することができなかった.Media Transcoderは複数のメディアへの変換,多様な様態への変換,他チャンネルへの変換を可能とし,障害者の持つ属性・障害の種類・障害の程度・好み・時間・場所に適応する技術(アダプティブテクノロジー)を有している.今後は,いつでもどこでもというユビキタス環境においても人間の認知可能なすべての活動に対してアノテーション(注釈・解説・補足・案内など)を付与することによって障害者のみならず,すべての人に優しい技術を通して社会に貢献をしていく所存である.

 

謝辞

ルビ振り技術開発のきっかけを与えてくださった中村美代子さん(慶応義塾大学SFC研究所),安村通晃教授(慶応義塾大学)および学術振興会産学協力研究委員会であるアクセス研究会の方々には趣旨に賛同していただきありがとうございました.また,石崎俊教授(慶応義塾大学)には,自然言語処理について有意義な示唆をいただきありがとうございました.最後に本システムの設計・開発にあたって小野和男さん,青木隆雄さんに多大なご協力をいただいたことに感謝いたします.

 

参考文献

[1] 長尾確:セマンティック・トランスコーディング-Semantic Webのために今やるべきこと-,情報処理学会第65回全国大会,2003

[2] 鳥原信一:長尾 :Semantic Transcoding-インターネットとヒューマン・ネットワークとの統合による障害者高齢者のバリアフリー-,電子情報通信学会第3回福祉情報工学研究会,20005

[3] Ismail Haritaoglu :Link from Real World to Digital Information Space

[4] http://chasen.aist-nara.ac.jp/

[5] 樋口文人:留学生のためのWorld Wide Web上での学習支援システム,19975

[6] http://www.adaptive-techs.com/

[7] http://www.w3.org/TR/ruby/#Status