◆ | report | ◆ |
脳の低次情報処理の実装〜背景に依存しない画像中の文字列抽出
|
◆ | 概要 | ◆ |
本研究では、背景に依存しない画像からの文字列抽出を行うニューラルネット ワークモデルを提案する。ディジタル画像からの文字認識は、従来から多くの 手法によって解法が提案されているが、パターン認識問題に特有な計算コスト の増大に耐え得るシステムは未だ実現されていない。本手法では、人間が持つ 視覚情報処理システムの階層構造に着目して柔軟な文字列抽出を実現し、従来 の研究に対するブレイクスルーを示す。 文字列は同じ色で構成された文字群の整然とした並びと定義する。まず、入力 画像に対してL*a*b 色空間を用いて色による領域分割を行い、さらに、色分割した各領域から一文 字を囲む外接矩形を抽出する。ニューラルネットワークは制約条件に従って外 接矩形をグルーピングし、効率的に文字列を抽出する。 提案する手法では、文字の形やフォントのような膨大な情報を扱うことなく文 字列を抽出し、ニューラルネットワークが画像認識にとって有効であることを 示した。 |
◆ | 目的 | ◆ |
複雑な背景の含まれた画像中から文字列領域のみを抽出する。
![]() 図1:本研究の目的:(上)入力画像;(下)出力画像 |
◆ | 問題意識 | ◆ |
![]() 図2:不完全なパターン境界生成の例 |
◆ | 文字列抽出の戦略 | ◆ |
・文字列のみを抽出する絶対的な条件を決めることは困難だ、と考えた。
![]() 図3:文字列と背景を分離する要因に関する図示;円と見えるか文字列と見えるかは人によって異なる
|
◆ | 実験結果 | ◆ |
![]()
|
◆ | まとめ、今後の課題 | ◆ |
|
◆ | 研究成果 | ◆ |
・ 学会発表
・ 論文
・ 特許
|
◆ | end of file | ◆ |