森泰吉郎記念研究振興基金 2002年度報告

研究課題名Genetic Programmingによる構造化3次元情景解析
研究代表者氏名田中頼人
所属大学院政策・メディア研究科 博士課程

研究手法の変更について

研究遂行上の理由により、申請書記載の研究課題「強化学習による立体認識機能の獲得」から研究手法部分の変更を行った。非決定論的なアルゴリズムを用いて入力画像からの立体認識を行うという方向性には変更はない。

研究目的

人間が持つ視覚機能を計算機で実現しようとするコンピュータビジョンでは空 間内に存在する物体が何でありどのような姿勢で置かれているかを認識するこ とが非常に重要である。この中でもモデル立体の3次元形状データが予め計 算機内に記憶されておりこのモデルを元にして入力画像中の立体を認識する「モ デル・ベースト」の処理は扱うモデル立体にほとんど依存しない汎用性 の高い手法である。モデル・ベーストによる立体の3次元姿勢決定を扱った研 究として長尾[97]やSaito[98]があるが、これらはモデル立体を単体で扱う処 理であり、複数の立体からなる構造化された情景を扱うものではない。

本年度の研究では空間を複数のモデル立体の集合演算による木構造として表現し、こ れをGenetic Programming(GP)の手法を用いて最適化させる枠組みを提案した。 これにより人間の知識の構造とマッチしやすい構造を入力画像から得ることが 可能となる。

背景

画像を用いて立体物の形状を推定する手法は古くから研究され、ステレオ視や Shape from Xとして多くの手法が提案されている。Xとしては輪郭(contour)、 陰影(shading)、動き(motion)、テクスチャ(texture)等があるがいずれの方法 も不完全で、現在ではレーザー光を用いたレンジセンサによる方法が実用シス テムの主流となっている。しかしレーザー光を用いる方法も分解能が低く黒い 対象物に適用できず、機器の取り扱いも困難であることから可視光による立体 認識は現在においても重要な研究課題である。

研究内容

本年度の研究で用いた手法はGenetic Programming(GP)である。これはGenetic Algorithm(GA)と同様の処理手順を用い、処理対象を一次元の記号列から木(tree)構造へと拡張したものである。木によって表現される対象として関数、手続きやプログラムなどがあり、GPを用いることによってこれらを進化(最適化)させることができる。 関数を木と見なす場合、木に対するcrossover(交叉)、突然変異(mutation)は下図のように表せる。

木に対するcrossover
木に対するcrossover

木に対するmutation
木に対するmutation

入力画像中の三次元情景をモデル立体(直方体、球など)による木構造と見なし、これをGPによる出力画像と照合しながら最適化処理を行う。

3次元情景解析のイメージ
3次元情景解析のイメージ

成果

上記の手法を用いた3次元情景解析ソフトウェアのプロトタイプ実装を WindowsXP,Microsoft Visual Studioの環境にて行った。これは 人工的に生成された3次元グラフィックスによる入力画像を用いて3次元情景の 最適化を行うものである。今後はこれにノイズへの耐性、光源位置変更への適 応等を調べるシミュレーション機能の追加を経て実画像への適用を目指す予定 である。

GPによる処理イメージ
GPによる処理イメージ

参考文献