研究課題名 | Genetic Programmingによる構造化3次元情景解析 |
研究代表者氏名 | 田中頼人 |
所属 | 大学院政策・メディア研究科 博士課程 |
人間が持つ視覚機能を計算機で実現しようとするコンピュータビジョンでは空 間内に存在する物体が何でありどのような姿勢で置かれているかを認識するこ とが非常に重要である。この中でもモデル立体の3次元形状データが予め計 算機内に記憶されておりこのモデルを元にして入力画像中の立体を認識する「モ デル・ベースト」の処理は扱うモデル立体にほとんど依存しない汎用性 の高い手法である。モデル・ベーストによる立体の3次元姿勢決定を扱った研 究として長尾[97]やSaito[98]があるが、これらはモデル立体を単体で扱う処 理であり、複数の立体からなる構造化された情景を扱うものではない。
本年度の研究では空間を複数のモデル立体の集合演算による木構造として表現し、こ れをGenetic Programming(GP)の手法を用いて最適化させる枠組みを提案した。 これにより人間の知識の構造とマッチしやすい構造を入力画像から得ることが 可能となる。
画像を用いて立体物の形状を推定する手法は古くから研究され、ステレオ視や Shape from Xとして多くの手法が提案されている。Xとしては輪郭(contour)、 陰影(shading)、動き(motion)、テクスチャ(texture)等があるがいずれの方法 も不完全で、現在ではレーザー光を用いたレンジセンサによる方法が実用シス テムの主流となっている。しかしレーザー光を用いる方法も分解能が低く黒い 対象物に適用できず、機器の取り扱いも困難であることから可視光による立体 認識は現在においても重要な研究課題である。
本年度の研究で用いた手法はGenetic Programming(GP)である。これはGenetic Algorithm(GA)と同様の処理手順を用い、処理対象を一次元の記号列から木(tree)構造へと拡張したものである。木によって表現される対象として関数、手続きやプログラムなどがあり、GPを用いることによってこれらを進化(最適化)させることができる。 関数を木と見なす場合、木に対するcrossover(交叉)、突然変異(mutation)は下図のように表せる。