森基金 研究成果報告書

慶應義塾大学大学院 政策・メディア研究科 修士課程 1 年 81324789 寺山淳基
(所属:Cyber Informatics)

研究課題名 T-Ring:センサデータの時間的関係性に着目した分散データ管理システム

研究概要

近年,センサネットワークは様々な用途で広く利用 されつつある.また,これらの複数のセンサ ネットワークを接続し,管理主体間でデータの授受を 可能にする取り組みも行われている. この,接続 されたセンサネットワークの集合体を,分散広域セン サネットワークと呼ぶ.分散広域センサネットワーク が一般的になり,任意のセンサデータがどの管理主体 から発せられたものかを意識することなく,誰もがあ らゆる場所からセンサデータを取得可能になった場合, この環境下でのセンサデータは公衆的であると言える. 従って,本研究では,この公衆化したセンサデータを公衆センサデータと呼ぶこととする. 公衆センサデータを対象としたデータベースを設計する際に考慮すべき点として,まず時間的関係性を挙 げられる.一般的な文書や音楽などのコンテンツは, 変更がなされない限り,時間によって中身が変わるこ とがない.その一方でセンサは,データと時刻が対に なり,初めて1つの意味を成す.従って,センサデー タの数は時間に比例して増加する.これは,センサ データ一般に該当するが,分散広域センサネットワー クで扱う総データ数は,従来のセンサデータ管理で扱 われていた数とは比較にならない程度の莫大な数にな ることは容易に想像できる.次に,センサデータの地 理範囲を指定した探索と時間範囲を指定した探索の両 方をユーザに対してストレスの掛からない時間で行う ことが挙げられる.従来の分散広域センサネットワー クにおいては,地理的な範囲検索が必要であることは 言われてきた.しかし,センサデータを用い たアプリケーションでは,時間的に連続したデータを 利用することが頻繁にあるので,時間的な範囲検索も 行える必要がある.T-Ring は,コンシステントハッシュと仮想ノード を用いて,処理の分散化と冗長性を実現し,さらに,時間範囲を指定した探索に焦点を当て,センサデータ に付与する,時間の幅に関する 2 つの時間属性に従っ て保存先ノードを変更することで,地理範囲と時間範 囲の両方を指定した検索時間を短縮する.実験の結 果,Time Slice Query では 62.82%延長したが,Time Interval Query では,98.51%以上の削減が実現した.

分散広域センサネットワークによるセンサデータの公衆化とその管理

分散広域センサネットワーク

独立して存在しているセンサネットワークを接続し, 1つの広域に広がるセンサネットワークとして扱うこ とを,分散広域センサネットワークと呼ぶ. センサネットワークは様々な用途で利用されている. 高齢者や入院患者の監視システムや睡眠の質 の改善のためプラットフォームなどモニタリング で利用されている.また,街中での人々の暮らしを便利 にするためにセンサデータの公開などを行う取り組み もある.また,JAWBONE,FUELBAND, fitbit などのライフロギングサービスによってセンサ ネットワークの個人利用も広まっている. この管理主体間を接続し,センサデータを相互に 授受可能にする分野広域センサネットワークに対す る取り組みも行われている.Sensor Andrewで は,構内に設置されたセンサネットワークを接続し, 環境モニタリングに活用している.GSNは,ヘ テロジニアスなセンサを統合的に扱うことにより,グ ローバルなセンサネットワークを構築している.ま た,xivelyは,世界規模で運用されており,サー ビス利用者が各々で管理しているセンサネットワーク のデータを公開,共有している.これらのサービスで は,ウェブインターフェースからデータの閲覧や提供 されている API 経由でのデータ取得が可能である.

公衆センサデータ

この分散広域センサネットワークが一般的になり, 任意のセンサデータがどの管理主体から発せられたも のかを意識することなく,あらゆる場所から取得可能 になった場合,このセンサデータは公衆的であると言 える.従って,本研究では,この公衆的にアクセス可 能なセンサデータを公衆センサデータと呼ぶことと する. 公衆センサデータには,一般特性として,遍在性, 多様性,長期性がある.遍在性は,センサデータが広 域に存在すること,多様性は,多様なデータタイプが 蓄積されること,長期性は,長期間分のデータがある ことである.公衆センサデータを利用することにより, 何処に移動しようと,常に自身の周辺に存在する温度 センサから真の体感気温を計測するアプリケーション や,地図上の指定した任意の領域のセンサの過去の データを利用し,移動ルートの環境情報予測をするこ とで,観光ルートの紫外線量を推定するアプリケー ションや,老人用のナビゲーションシステムに活用す ることができる.

公衆センサデータの管理

地理範囲検索と時間範囲検索
前節までに述べた前提が存在する上で,公衆センサ データが遍在する環境において利用されるアプリケー ションを考慮した際に,不可欠な機能要件として,ま ず,センサデータの地理範囲検索がある.地理範囲検 索は,SPACIALP2P,Mill,LL-Netなど で行われている.これらの研究では,地理的に分散し ているデータを緯度,経度情報を元にデータの抽出 を行っている.もう 1 つの要件として,時間範囲検索 がある.時間範囲検索とは,時刻情報を持ったデータ 群の中から,時間の範囲を指定し,その指定した範囲 に含まれるデータ群のサブセットを取得する検索であ る.環境モニタリングアプリーケーションの場合,セ ンサの値を時間的に継続して監視することで,イベン トの発生検知や,環境変化の傾向の補足が可能になる. よって,時間範囲を指定した検索も地理範囲検索と同 様に行える必要がある.従って,公衆センサデータの 管理においては,この地理範囲,時間範囲の両検索を 同時に実現し,かつ,高速に行えなければならない.
センサデータの時間的関連性
インターネットを介してグローバルに授受されてき たデータとして,文書,音楽,動画などがある.本研 究ではこれらを一般データと呼ぶ.この一般データと 比較して,センサデータには時間的な特徴がある.あ るデータが意味を持つためには,一般データの場合, コンテンツそのものさえ人や計算機が認識できる形で 存在していれば十分である.その一方で,センサデー タの場合,センサから発せられた値やそのセンサに関 する属性に加え,時刻情報が不可欠である.具体的に は,ある温度センサから情報を取得する場合,20 度と いう値にある時刻が結びつくことで,はじめて有用な 情報となる.従って,一般データを取得する際,図 1 の左図の破線内のオブジェクトを参照すればよい.し かし,センサデータは時刻と共に管理する必要がある ので,図 1 の右図の破線内のように,時刻によって全 て異なるオブジェクトとして扱わなければならない. よって,データの量は時間の経過に従って増加する. これをセンサデータの時間的関連性による増加と呼ぶ. このセンサデータの特徴は,公衆センサデータにお いて特に考慮すべき点である.公衆センサデータは あるアプリケーションに特化して設置されているデー タではない.従って,公衆センサデータはイベント駆 動でデータがサーバに送られる訳ではなく,定期的に サーバにデータを送り,それが蓄積されていく.そし て,そのデータの総量は時間の経過と共に増加してい く.データ利用時には,その大量のデータ群から必要 なデータを検索する必要がある.また,センサデータ を用いたアプリケーションは,一時刻のデータではな く,一連の時間的幅を持ったデータを利用することが 多い.モニタリングアプリケーションの場合,異常な 状態と判断されるのは,正常な状態があり,それに対 して,異常な値がデータとして観測された時である. この正常な状態を定義するには,時間的幅を持った データの分析が必要である.また,ライフログサービ スにおいても,自身の体調の変化などを見る場合には, ある時間的幅を持ったデータが可視化されていなけれ ばならない.このように,あらゆるアプリケーション では,時間的に幅を持ったデータが利用される.以上 から,公衆センサデータの利用を考えた場合,蓄積さ れたデータの中から,時間的幅を持った一連のデータ を検索が可能,かつ,高速でなければならない.

図1 公衆センサデータ管理概念図 

対外活動及び結果まとめ

電子情報通信学会知的環境とセンサネットワーク研究会 2013/5/16-17 熊本

“T-Ring:センサデータの時間的特殊性に着目した多次元データ分散管理”というタイトルで,センサデータの時間的特殊性の内,時間の経過に従って,データ量が増大するという点に着目し,このような特徴を持ったデータに対して有効な分散データ管理の手法について発表を行う.

電子情報通信学会若手研究者のための未来開拓特集への投稿 2013/12

2013年12月に電子情報通信学会若手研究者のための未来開拓特集号への投稿を行いました.結果としては,残念ながら不採録でしたが,現在,頂いたコメントを反映させて,再度投稿を目指して,執筆中です.