〜 帰納論理プログラミングによる技能の解析に関する研究 〜

共同研究 活動報告

尾崎 知伸 (大学院 政策・メディア研究科 博士課程)


目的

本研究(帰納論理プログラミングによる技能の解析に関する研究)の研究課題は,(1)人間の技能の解明を行うために,技能的な動作に伴う筋電図などのデータを取得し,そのデータを,人工知能に基づく新たなデータ解析手法として注目を集めている帰納論理プログラミング(ILP)の手法により,解析する.(2)その解析結果から,技能的動作を実現するための,基本的な動きや力の入れ具合いなどを抽出し,高度な技能にとって必要な筋肉の制御モデルの構築に役立てる,ことである.

そこで,帰納論理プログラミングを用いた技能解析システムを開発するために,帰納論理プログラミングの理論・システム開発・応用に関して先進的な研究を行っている 英国York大学 計算機科学科 Stephen Muggleton教授らの研究グループを訪問し,綿密な意見交換および共同研究を行う.また共同研究を通して,特に大規模データの扱いの観点から,技能解析システムに必要とされる理論やアルゴリズム,応用可能な既存技術を検討し,実際のシステム開発の方向性を明確にすること,を主な目的とする.

訪問先・日程

訪問先:英国 York大学計算機科学科 Stephen Muggleton教授
期間:1999年11月2日〜22日
日程:
11/2York大学 着
本研究の趣旨,概要,現在の研究状況に関する説明
S.Muggletonらの研究グループの研究の視察
11/3
〜21
共同研究
  • 技能解析に必要とされる理論・アルゴリズムの検討
  • 適用可能な既存技術(特に大規模データへの対応のためのデータベース技術)の検討
  • データベースを用いた帰納論理プログラミングシステムの改良
  • 帰納論理プログラミングシステムProgolに特化したアルゴリズム
など
11/22成果発表会

研究内容 および 研究成果

人間の動作を解析するには,人間の骨格・筋肉の情報,および動作に伴う筋電図などの複雑かつ大規模なデータを処理する必要がある.そこで,特に大規模問題への対処という観点から,開発するシステムに必要となるアルゴリズムや技術に関して意見交換および調査を行った.調査は主に,(1)データマイニング,(2)帰納論理プログラミング,の2つの分野を対象にした.以下,これらの調査結果に関して簡単に述べる.

現在開発されている主なデータマイニングの手法は,帰納論理プログラミングに比べて表現能力は低いものの,大規模問題に特化したものが多く,特に近年関係データベースの利用に関して盛んに研究が行われている.関係データベースは元々大規模データの扱いに長けており,その意味で,関係データベースを利用することは直接規模の問題への対処となる.またデータベースにより提供される,効率の良いメモリ管理,並列実行,データの復旧などは,データマイニングにおいて非常に有効であることが知られている.さらに,データベースを利用することで,データをマイニングシステムに転送することなく,直接解析が出来るという点でも有望である.更に近年の研究では,(i)データマイニングのための問い合わせ言語の開発や,(ii)データマイニングに特化したデータベースサーバの拡張,(iii)データマイニングのための問い合わせ最適化に関して盛んに研究が行われている.さらに,(iv)いつかのデータマイニングアルゴリズムをSQL言語上で実装するという試みがなされている.

帰納論理プログラミングの大規模問題への適用に関しては, (i)確率的探索や,遺伝的アルゴリズムの利用などの高度な探索アルゴリズムの開発, (ii)並列実装, (iii)サンプリングやデータ分割, (iv)データベースの利用, に関して研究が行われている.また,これまでに我々も,S.Muggleton教授らによって開発された,帰納論理プログラミングシステムProgolとデータベースとの連結に関して研究を行っている.

これらの意見交換,調査の結果を踏まえ,これまでに我々が開発した関係データベースと連結したProgolシステムを対象に,データマイニングの分野で研究が進められているSQLによるマイニングエンジンの実現方式を組み込む方針で共同研究を進めた.以下,Progolと関係データベースシステムとの連結,およびSQLによるデータマイニングアルゴリズムに基づく改良について簡単に述べる.

帰納論理プログラミングシステムProgolにおける処理は,(i)最弱仮説の生成,(ii)最弱仮説によって形成される仮説束内の探索(仮説の生成と評価の繰り返し),(iii)仮説によって説明される事例の排除,の大きく3つに分けられる.またこれらの処理は,Prologのゴール実行という形で表現することが可能である.従って,それぞれPrologのゴール実行をSQLで表現し,関係データベース上で実行することで,Progolシステムと関係データベースの連結が達成される.

しかし実際には,PrologとSQLの表現能力の差を利用して,複数のProlog実行を一つのSQL文で表現することが可能である.この特徴を積極的に利用することで,データーベースへのアクセス回数,データのスキャン回数を減らし,システムの実行効率を高めることが可能であると考えられる.実際,SQLによる相関ルールマイニングや,決定木の生成においては,SQLの'GROUP BY'を用いて,データベースへのアクセスを減らし,より効率的な実装が実現されている.今回の共同研究では,これらの技術を参考に,(ii)の探索において,複数の仮説の評価をGROUP BYを伴う一つのSQL文で実現するための構文的な条件を明らかにした.また,相関ルールマイニングにおける探索方式を利用して,より積極的に探索空間の枝刈りが行えることも示した.さらに(i)最弱仮説の生成に関しては,通信量を減らし,より密接にデータベースを利用した計算方式を開発した.

これらの共同研究を通じて,帰納論理プログラミングで必要とされるの複雑な処理を実現し,より密接な連結を実現するためには,関係データベースだけではなく,オブジェクト指向の拡張(Object-Relational Database)が有効であるということも明らかとなった.

これらの内容に関して,''Integration of an ILP system Progol withRelational Database''というタイトルで,York大学計算機科学科のArtificial Intelligence Interest Group Seminarにて,発表を行った(発表資料).


[ 戻る ]