2004年度森基金研究成果報告書[101]

2004年度森基金-研究成果報告書-採択番号101

オブジェクト指向ベイジアンネットを用いた
コンテクスト構築フレームワーク

慶応義塾大学, 政策・メディア研究科
修士課程2年, 徳田研究室, 80331573
門田昌哉

はじめに

近年の計算機の小型化や、短距離無線通信技術の発展に伴い、アプリケーション自身がユーザや環境の状態(=コンテクスト)を検知し、自律的に動作する計算モデルが注目を集めている。ベイジアンネットは、複数のセンサデータ群から規則性を抽出し、単一のセンサでは検知できない人間活動や異常状態などのコンテクストを検知するための情報モデルとして有望である。たとえば、「会議中」であるコンテクストを照度センサや研究室のメンバの位置情報から検知したり、柱や床に取り付けた加速度センサから異常状態を検知するなどが挙げられる。

しかし、ベイジアンネットを使ってコンテクストを構築するためには、センサネットワークや確率統計への専門知識が必要である。そのため、金銭的な側面から、オフィスや家庭などの専門家が介入しにくい環境において、ベイジアンネットをコンテクストを抽出するモデルとして利用しにくい問題がある。また、ベイジアンネット自体がハードウェアの論理回路に似た構造を持っており、モデルの規模が大きくなるにつれてモデル化に必要となる労力が問題となる。

本研究報告では、ベイジアンネットの拡張であるオブジェクト指向ベイジアンネットを用いて、コンテクストを簡易に構築可能にする「Jenga Framework」について述べる。Jenga Frameworkの特徴は、特定のコンテクストを抽出するベイジアンネットのネットワーク構造(どのような情報を検知できるセンサが必要であるのか、そしてそれらがどのような因果関係を持つのかをグラフ構造として定義)を環境に依存しない一般的なパターンとして、あらかじめ知識ベース化しておき、それを個々の環境に対して動的に適応させられる点にある。ただし、特定の環境や個人に依存する情報*1はあらかじめ定義できないため、EM法や Gibbs Sampling法などの機械学習アルゴリズムを適用する。Jenga Frameworkは、これらの要件を満たすソフトウェア群をフレームワークとして提供する*2。

*1 たとえば、筆者が部屋を出たとき、トイレに行くのか喫煙に行くのかといった情報はあらかじめ定義できない。これらの情報は、蓄積されたセンサデータ群から機械学習する必要がある(=ベイジアンネットのパーソナライズ)。

*2 特に、ベイジアンネットをグラフィカルに構築するためのユーザインタフェースや推論アルゴリズム、学習アルゴリズムなどのJava言語による実装を試験的にSFC内部向けに公開している。ソフトウェアは以下のページよりダウンロードできる。
Jenga Frameworkのダウンロードページへ

Jenga Framework

Jenga Frameworkは、1)多様なセンサ群の抽象化層、2)ベイジアンネットの適応、および推論層、3)ディレクトリサービス層の三つ層から構成される。以下にそれぞれの層について簡潔にまとめる。

1) 多様なセンサの抽象化層

汎用的にベイジアンネットのパターンを知識ベース化するためには、環境によって異なるセンサの多様性を隠蔽する必要がある。そのため、多様なセンサの抽象化層において、1-1)識別子の抽象化、1-2)検出頻度の抽象化、1-3)精度の抽象化の三つの抽象化を行うことで、特定の環境に依存すること無く、一般的にベイジアンネットを定義可能になる。

2) ベイジアンネットの適応、および推論層

知識ベース化されたベイジアンネットを、個々の環境に対して適応させ、蓄積されたセンサデータ群より確率分布を学習させる。ネットワーク構造の適応は、個々の環境で利用可能なセンサ群と事前に定義された型への一致度を計算して動的に行う*3。確率分布の学習アルゴリズムにはEM法と呼ばれる、欠損値を含むデータ群より確率分布を学習可能なアルゴリズムを採用することで、ユーザが学習データを作成する手間を削減する設計をとっている*4。

3) ディレクトリサービス層

アプリケーション群は、興味があるコンテクストの状態をXMLを用いた言語を用いて検索する。検索結果は、コンテクスト名+確率値である。例えば、会議コンテクストが70%を超えた場合には電話を転送しないなどのアプリケーションが考えられる。

*3 センサとあらかじめパターンとして定義されたセンサの型との一致度の計算はベクトル空間モデルを用いて行う。個々のセンサは、検知可能な対象(照度、１m範囲の物の動き、部屋単位での入退室管理など)から特徴ベクトルを持ち、ベクトル間の余弦値をもって類似度とする。

*4 通常、ベイジアンネットの学習は完全データ(すべての構成要素に対応するデータが取得可能である)を想定した場合、確率分布の学習は単純にデータの比率から求められる。しかし、コンテクスト自身の状態は検知不可能(なぜなら、センサデータ群からコンテクストの状態を推定したいため、コンテクスト自体のデータは所与ではない)であるため、完全データを作成するためには、特定の状況において、ユーザが実際にそのコンテクストに居たかどうかを学習データとして作成する必要がある。Jenga Frameworkでは、この手間を削減するために、 EM法を応用した。

Graphical BN/OOBN Modeling Tool

Jenga Frameworkでは、前節で述べた 2)ベイジアンネットの適応層の一部として、適応的に生成されたベイジアンネットが求める精度を満たさない場合や、改変を行う必要があった場合にグラフィカルにモデルを改変するためのユーザインタフェースを提供する。これは、汎用的な用途でも利用できるように設計したため、金融工学やマーケティングなどにおいてベイジアンネットを応用する場合にも有用である。

位置情報/会議状態の検知例

以下の図に、位置情報の検知モデルと、会議状態の検知モデルを前節で述べた Graphical BN/OOBN Modeling Toolを用いて描画した画面をそれぞれ示す。

図：位置情報の検知モデル

図：会議状態の検知モデル

終わりに

本研究成果報告書では、人や環境の状態を検知するためのベイジアンネットを簡易に構築可能とするJenga Frameworkについて述べた。本研究の成果を修士論文としてまとめ、最終発表会において発表した。また、国内の学会において本研究成果を論文として発表する予定である。Jenga Frameworkの実装や、論文発表などは以下のページにて随時行う予定である。