2004年度森基金-研究成果報告書-採択番号101

オブジェクト指向ベイジアンネットを用いた
コンテクスト構築フレームワーク

慶応義塾大学, 政策・メディア研究科
修士課程2年, 徳田研究室, 80331573
門田 昌哉

はじめに

近年の計算機の小型化や、短距離無線通信技術の発展に伴い、アプリケーショ ン自身がユーザや環境の状態(=コンテクスト)を検知し、自律的に動作する計算 モデルが注目を集めている。ベイジアンネットは、複数のセンサデータ群から 規則性を抽出し、単一のセンサでは検知できない人間活動や異常状態などのコ ンテクストを検知するための情報モデルとして有望である。たとえば、「会議 中」であるコンテクストを照度センサや研究室のメンバの位置情報から検知し たり、柱や床に取り付けた加速度センサから異常状態を検知するなどが挙げら れる。

しかし、ベイジアンネットを使ってコンテクストを構築するためには、センサ ネットワークや確率統計への専門知識が必要である。そのため、金銭的な側面 から、オフィスや家庭などの専門家が介入しにくい環境において、ベイジアン ネットをコンテクストを抽出するモデルとして利用しにくい問題がある。また、 ベイジアンネット自体がハードウェアの論理回路に似た構造を持っており、モ デルの規模が大きくなるにつれてモデル化に必要となる労力が問題となる。

本研究報告では、ベイジアンネットの拡張であるオブジェクト指向ベイジアン ネットを用いて、コンテクストを簡易に構築可能にする「Jenga Framework」に ついて述べる。Jenga Frameworkの特徴は、特定のコンテクストを抽出するベイ ジアンネットのネットワーク構造(どのような情報を検知できるセンサが必要で あるのか、そしてそれらがどのような因果関係を持つのかをグラフ構造として 定義)を環境に依存しない一般的なパターンとして、あらかじめ知識ベース化し ておき、それを個々の環境に対して動的に適応させられる点にある。ただし、 特定の環境や個人に依存する情報*1はあらかじめ定義できないため、EM法や Gibbs Sampling法などの機械学習アルゴリズムを適用する。Jenga Frameworkは、 これらの要件を満たすソフトウェア群をフレームワークとして提供する*2。

*1 たとえば、筆者が部屋を出たとき、トイレに行くのか喫煙に行くのかといっ た情報はあらかじめ定義できない。これらの情報は、蓄積されたセンサデータ 群から機械学習する必要がある(=ベイジアンネットのパーソナライズ)。

*2 特に、ベイジアンネットをグラフィカルに構築するためのユーザインタフェー スや推論アルゴリズム、学習アルゴリズムなどのJava言語による実装を試験的 にSFC内部向けに公開している。ソフトウェアは以下のページよりダウンロード できる。
Jenga Frameworkのダウンロードページへ


Jenga Framework

Jenga Frameworkは、1)多様なセンサ群の抽象化層、2)ベイジアンネットの適応、 および推論層、3)ディレクトリサービス層の三つ層から構成される。以下にそれ ぞれの層について簡潔にまとめる。

1) 多様なセンサの抽象化層

汎用 的にベイジアンネットのパターンを知識ベース化するためには、環境によって 異なるセンサの多様性を隠蔽する必要がある。そのため、多様なセンサの抽象 化層において、1-1)識別子の抽象化、1-2)検出頻度の抽象化、1-3)精度の抽象 化の三つの抽象化を行うことで、特定の環境に依存すること無く、一般的に ベイジアンネットを定義可能になる。

2) ベイジアンネットの適応、および推論 層

知識ベース化されたベイジアンネットを、個々の環境に対して適 応させ、蓄積されたセンサデータ群より確率分布を学習させる。ネットワーク 構造の適応は、個々の環境で利用可能なセンサ群と事前に定義された型への一 致度を計算して動的に行う*3。確率分布の学習アルゴリズムにはEM法と呼ばれ る、欠損値を含むデータ群より確率分布を学習可能なアルゴリズムを採用する ことで、ユーザが学習データを作成する手間を削減する設計をとっている*4。

3) ディレクトリサービス層

アプ リケーション群は、興味があるコンテクストの状態をXMLを用いた言語を用いて 検索する。検索結果は、コンテクスト名+確率値である。例えば、会議コンテク ストが70%を超えた場合には電話を転送しないなどのアプリケーションが考えら れる。

*3 センサとあらかじめパターンとして定義されたセンサの型との一致度の計算 はベクトル空間モデルを用いて行う。個々のセンサは、検知可能な対象(照度、 1m範囲の物の動き、部屋単位での入退室管理など)から特徴ベクトルを持ち、 ベクトル間の余弦値をもって類似度とする。

*4 通常、ベイジアンネットの学習は完全データ(すべての構成要素に対応する データが取得可能である)を想定した場合、確率分布の学習は単純にデータの比 率から求められる。しかし、コンテクスト自身の状態は検知不可能(なぜなら、 センサデータ群からコンテクストの状態を推定したいため、コンテクスト自体 のデータは所与ではない)であるため、完全データを作成するためには、特定の 状況において、ユーザが実際にそのコンテクストに居たかどうかを学習データ として作成する必要がある。Jenga Frameworkでは、この手間を削減するために、 EM法を応用した。


Graphical BN/OOBN Modeling Tool

Jenga Frameworkでは、前節で述べた 2)ベイジアンネットの適応層の一部とし て、適応的に生成されたベイジアンネットが求める精度を満たさない場合や、 改変を行う必要があった場合にグラフィカルにモデルを改変するためのユーザ インタフェースを提供する。これは、汎用的な用途でも利用できるように設計 したため、金融工学やマーケティングなどにおいてベイジアンネットを応用す る場合にも有用である。


位置情報/会議状態の検知例

以下の図に、位置情報の検知モデルと、会議状態の検知モデルを前節で述べた Graphical BN/OOBN Modeling Toolを用いて描画した画面をそれぞれ示す。


図:位置情報の検知モデル



図:会議状態の検知モデル

終わりに

本研究成果報告書では、人や環境の状態を検知するためのベイジアンネットを 簡易に構築可能とするJenga Frameworkについて述べた。本研究の成果を修士論 文としてまとめ、最終発表会において発表した。また、国内の学会において本 研究成果を論文として発表する予定である。Jenga Frameworkの実装や、論文発 表などは以下のページにて随時行う予定である。

http://www.ht.sfc.keio.ac.jp/~masaya/