2010年度森基金報告書

研究題目「スマートフォン利用者を対象とした異種情報資源からの自動情報配信の実現」

 

慶應義塾大学大学院 政策・メディア研究科

修士課程1

学籍番号 81025590

矢部竜太

 

研究概要

本研究は、スマートフォンを中心としたモバイル・コンピューティング環境において,スマートフォン利用者を対象とした異種情報資源からの自動情報配信システムを実現するものである。この研究を行う背景として、・GPSを搭載したモバイル機器が普及したことにより位置情報を利用した情報配信サービスの重要性が高まっていることが挙げられる。

既存の位置情報を利用した情報配信サービスには、ユーザの興味や嗜好・現在地と関係性の無い情報が送られてくるという問題点がある。その原因は、既存の情報配信サービスが座標検索やキーワード検索、カテゴリ検索により配信情報を検索しているため、モバイルユーザの絶え間ない所在地の変化に伴う興味の変化や、またモバイルユーザの興味・関心が複数の要素から構成されていることに対応出来ていないからである。

上記の問題点を解決するためには配信情報とユーザの関係性を動的に計量するシステムが必要となる。しかし、ユーザと配信情報の関係性を計量するためには、緯度経度等の座標情報と配信情報の間には意味的な異種性があるために直接関係性を計量することが難しいという課題を克服する必要がある。

 

提案方式

本研究では、スマートフォン利用者を対象とした異種情報資源からの自動情報配信の実現するために配信情報とユーザの関係性を動的に計量する方式を提案した。本方式では、ユーザの座標情報と配信情報群の関係性を「ユーザが現在地いることで、もしくは配信情報をえることで実現したい行動の目的」という観点から動的に計量するためのメタレベルの計量空間を定義する。そして、座標情報や配信情報の特徴を表すメタデータをユーザの行動の目的という抽象度の高い情報へ変換し、メタレベル計量空間上へマッピングするための変換マトリクスを定義する。システムはメタレベル計量空間上のベクトルとしてユーザの所在地と配信情報を変換マトリクスにより、メタレベル計量空間上にマッピングし、両者の関係性を計量する。

本方式の特徴として、配信情報やユーザの地理的状況を複数の要素から成り立つベクトルとして表現することが挙げられる。また、配信情報とユーザの関係性をベクトルの内積により動的に計量することにより両者の疎結合を実現する。

この方式の利点として、表現できる行動の目的の組み合わせが従来の方式に比べて多いことが挙げられる。しかし、メタレベル計量空間上にユーザの座標や配信情報をマッピングするために必要な変換マトリクスの定義が、表現できる行動の目的の組み合わせの量に対して少なく済ませることが出来る。また、変換マトリクスの定義さえ行えれば、未知の情報資源を配信することも可能となる。

図2.emf

:システム概要

 

システムの実装

本節は、本方式の実現方式の説明である。実装に用いたプログラミング言語はJavaPostgreSQLを用いた。また、GISデータベースを構築するにあたり、PostgreSQLを拡張したPostGISを用いた。また、アプリケーションサーバにはGlassFishを用いた。

関係性計量アプリケーションの実装

 関係性計量アプリケーションは、提案方式である、ユーザの実空間における所在地と、情報空間上の情報の関係性計量を実現するシステムである。本システムは、モバイル機器から緯度経度を取得すると、ユーザの実空間における地理的状況と情報空間上の情報の意味的状況の関係性の計量結果を表示してくれるサーバサイドのアプリケーションである。また、本システムはGoogleMap上で指定した位置座標を元に関係性を計量することも可能である。

 

本方式を応用した、ユーザ現在地とWeb閲覧状況関係性計量システムの実現

本節は、関係性計量アプリケーションを拡張し実装した、ユーザの実空間状況と過去に閲覧したWeb文書群との関係性を計量するシステムの説明である。本システムは、関係性計量アプリケーションに、さらに以下の3つのモジュールを追加した。

l  ユーザWeb閲覧履歴収集モジュール

 本モジュールは、ブラウザの閲覧履歴に記録されているユーザの閲覧したURLと日付を取得し、取得したURLからHTMLを取得する。本モジュールは、取得したHTMLからタグを正規表現で除去した後、形態素解析を行なう。本モジュールは、形態素解析された各単語のうち、名詞のみ、HTMLを取得したURL、ユーザが閲覧した日付を紐付けてPostgreSQLに格納する。本モジュールのHTML取得機能はHTMLパーサライブラリJerichoを用いて実装した。本モジュールの形態素解析機能は日本語形態素解析ライブラリSenを用いて実装した。

 

l  特徴量算出モジュール

 本モジュールは、ユーザが閲覧したHTMLを構成する単語群の特徴量を算出する。さらに、算出した特徴量から、ユーザがどのようなカテゴリの商品に興味を持っているかという情報への再変換を行う。再変換を行う理由は、HTMLを構成する特徴語群の数は多く、それら全てに変換マトリクスの変換定義を書く手間が膨大となるためである。本システムは再変換にはAmazon APIを利用している。その理由は、AmazonAPIは、リクエストを投げると、キーワードに該当する商品ヒット件数を、各商品カテゴリに返してくれるからである。

 ただし、本実装では、Amazonが定義している商品カテゴリのうちBooks、及びForeignBooksという本を扱うカテゴリ二つは除外している。理由は、本は取り扱う内容が幅広いため、どのようなキーワードを投げても十中八九、本のカテゴリにヒットしてしまうためである。

図4.emf

図1.emf

:GoogleMap上で指定した座標と、ユーザの興味・関心との関係性を計量するシステム

実験

 実装したシステムを使って、ユーザのWeb閲覧履歴とユーザの地理的状況の関係性を計量する実験を行った。

 

・実験対象仮想ユーザ像

本実験では「テレビを買い換えようと思っているため、インターネット上でテレビに関する情報を家電量販店のサイトや通販サイトなどで収集している」という仮想ユーザ像を想定した。想定した仮想ユーザ像にそってWebサイトの閲覧履歴の作成を行った。閲覧履歴を作成するにあたり、家電情報を取り扱っているサイトごとに、テレビ商品の情報ページ15件を閲覧した。実際に閲覧を行ったサイトは以下の4サイトである。

 

Amazon

http://www.amazon.co.jp/

ヨドバシカメラ

http://www.yodobashi.com/

ビックカメラ

http://www.biccamera.com/

価格コム

http://kakaku.com/

システムは、作成されたユーザのWeb閲覧履歴の特徴量を算出し、ユーザの所在地との関係性を計量する。

 

・実験ルート

本実験は、対象地域を横浜駅近辺と設定した。本実験は、横浜駅周辺に移動ルートを設定し、約100mごとに全14の関係性計量ポイントを設定した。この14の関係性計量ポイントのうち、家電量販店であるヨドバシカメラ、及びビックカメラが半径50m以内にある2ポイントを正解ポイントと設定した。本実験では、システムが、各計量ポイントとWeb閲覧状況との関連性を計量する。また、比較対象として、明示的に「家電に興味がある」とユーザが入力した場合を想定したデータを作成し、関係性の計量を行った。本実験は、正解ポイントにおいて計量結果の値が6.5を超えた場合は正解、また、正解ポイント以外では計量結果の値が6.5以下になった場合は正解とした。

 

図2.emf

図:横浜駅周辺に設定された実験ルート(4,12が正解ポイント)

 ・実験結果

本節は、関係性計量実験結果の説明である。Web閲覧文書との関係性計量結果は、正答率は78.6%となった。明示的に入力したユーザの興味・関心との関係性計量結果は92.9%となった。

図3.emf

 

まとめ

 今回実装したシステムにより、提案した方式の有効性を示すことが出来たと考えられる。変換マトリクスを定義することが出来れば、人手であれ、システムによる自動的な方法であれ、メタデータを付与した情報とユーザの所在地との関係性を計量することが出来たと考えられる。