2003年度 森泰吉郎記念研究振興基金 研究助成金報告書



「周波数解析と適応信号処理識別子を用いた電子透かしとコンテンツ保護の研究」
慶應義塾大学大学院 政策・メディア研究科
修士課程2年 ITプログラム ノーベルコンピューティングプロジェクト所属
直江 健介(naoe@sfc.keio.ac.jp)


研究課題
 周波数変換処理と非線形な適応信号処理を用いた新しい電子透かしの埋め込み・抽出手法の研究

研究背景と目的
 近年、インターネットや計算機の処理性能が飛躍的に向上してきたため、 マルチメディアなデジタルコンテンツの作成が極めて容易になってきたという状況がある。 また情報のデジタル化が進み、ますますデジタルコンテンツの公開や配布が 簡単になってきた。そのため21世紀は情報の時代であるといわれている。 これは普段の生活の中で扱う情報自身が持つ価値がこれまで以上に高まってきている ということである。

 現在、デジタルコンテンツは多種多様なビジネスで利用されているが、 デジタルという特性上、コンテンツの品質が優れているのにも関わらず、 何度繰り返して複製を作っても品質の劣化が無く、取り扱いが簡単であるという特徴がある。 今までは情報自体には形がないといっても、情報を記録するためには、紙、 磁気テープ、メモリなどといった物理的な媒体が必要であった。 それらの記録媒体を管理することで今までは著作権の管理や保護が行われてきた。 しかしインターネットの普及によりこれらのデジタルコンテンツを公開することが 可能になり、またコンテンツの量が数多く分散して公開されているため、 記録媒体の管理による著作権の保護が大変難しくなってきた。

 デジタルメディアが登場する以前においては、著作物を複製、模写するために必要と なった経費や時間、コピーをすることにより発生する品質の劣化というものが、 著作物の不正コピーや不正使用といった行為の抑止力となっていた。 デジタルメディアの登場以降、経費や時間、品質の劣化などといった問題が解消されたが、 マルチメディアの高機能化による、ファイルそのものの容量の大きさが不正コピー等の 抑止力となっていた。

 しかし昨今のMP3,JPG,MPGなどに代表されるファイル圧縮技術の進歩により、 個人レベルでのファイルの入手、交換が容易に可能となってきた。そのため、 これらのコンテンツが著作者の意図しない所で一人歩きすることもありえ、 現実では他人の著作物を平然と複製し利用されるという可能性を常に抱えている。 最近の事例では、P2Pアプリケーションなどを使った無許可なファイル共有や交換、 ファイルやアプリケーションの不正利用やデジタルコンテンツの著作権侵害などが、 多くの一般ユーザレベルでも行われていたという状況は記憶にも新しい。 このようなことから、新たな抑止力となりうる著作権管理のメカニズムが 求められ始めている。

 従来の解決策の一つとして、著作者の作成した情報コンテンツを一種の財産と して扱えるように、著作権という権利が認められており、この法律を利用する方法がある。 しかし、デジタルコンテンツの著作者が自分であると主張するためには、 それらの著作物に署名を施す必要がある。今までマルチメディアの作品には ほとんど署名が施されていなかった。 しかし現在のコンテンツビジネスのようなビジネスモデルが成長するためには、 著作権の保護、主張、正当な課金、不正コピーの防止などの対策のために何らかの方法で 署名などの情報をコンテンツに付与する仕組みを構築することが急務となる。 このようなことから、悪意の第三者に、著作者の断りなくデジタルコンテンツが 悪用されたり、不正にインターネット上を流通した場合、法的手続きをとるためにも 証拠として、著作者情報などをコンテンツに忍ばせる電子すかしを中核とした、 著作権を保護する新しい技術の登場が切望されている。

 その中でも電子透かしと呼ばれる技術が最近注目を浴びてきている。 電子透かしとは、映像や音楽といったデジタルコンテンツそのものに、 コンテンツの管理に必要な著作者情報などといった情報を、透かしとしてコンテンツに 対して埋め込む技術である。この透かし情報は、埋め込んだ本人にしかわからない 方法で、必要なときに透かしをコンテンツから抽出することで、著作権の主張や 本物の証明などといった用途に用いる技術である。

 電子透かしは、絵画などの署名のように、目に見えるような形で埋め込む 手法のものもあれば、人間の感覚器官による知覚が出来ない程度に、 コンテンツに対して透かし情報をそっと埋め込む方法がある。 しかし、どのような形で透かしを埋め込んだとしても、 オリジナルのコンテンツに情報を付加するため、意図するオリジナルの コンテンツとはファイルサイズや見かけ上の変化などを伴ってしまう。 この問題は特に、コンテンツがそのままの形で公開されることに意味がある、 芸術作品のような著作物である場合において非常に重要な問題となる。 そのため近年では静止・動画像などでは不可視、音声では聴覚不能な透かしを 埋め込む技術が発展してきた。本研究では静止画像における電子透かしの研究であるため、 このことを念頭においた新しい電子透かし手法の提案を目的とする。

研究の特徴
 提案する手法では前述したような要求を達成する技術的な仕組みを用意する必要がある。 提案手法で満たしたい要件として、いかに少ない埋め込み情報で電子透かしの機能を 達成するか、ということがある。このことは、埋め込み情報が少なければコンテンツに 与える影響を最小限にすることが出来るため、非常に重要である。 また埋め込む透かしは著作権情報などを扱うため、コンテンツなどに対する 画像処理や除去攻撃などに耐えうる性質を持つことが電子透かしには求められる。 この要件を満たすには、画像を直交周波数空間に変換後の係数を選択し、 その周波数空間に対して透かしを埋め込む手法を用いる。 このことで画像に与える影響を最小限にすることが出来る。

 また、本研究では埋めこめられた透かしを検出するという問題を、 一種の特徴認識問題として捉えることで、コンテンツに埋めこめられた透かしを 識別する方法を提案する。これは非線形適応信号処理システムを用いることで、 透かしを埋め込む画像の特定領域の特徴情報を入力とする学習を行い、 その学習結果を透かしの復号鍵として用いることで実現する。この復号鍵は画像には 直接埋め込まず、非線形適応信号処理システムの入力に用いた特徴情報が所在する 位置情報のみを埋め込むことで、コンテンツの品質を抑える。

 本論文では提案手法と、提案手法が関連する先行研究の手法とを比べながら、 提案手法を用いた時において、透かしを埋め込む際に変更を必要とする画像の 画素数の削減、フィルタ処理などに対する耐性、復号鍵の秘匿性という観点についての 評価実験や考察を行った。

研究の流れ
 基本的には以下の図に示した、当初計画していた通りの予定に沿って研究を行った。


図1.研究の流れ


○研究ライン1:比較対象手法の関連研究サーベイ
 ここでは、本研究で扱う提案手法の比較対象となる手法に関して、 関連論文のサーベイを行った。対象となる手法は、量子化誤差利用型電子透かし、 周波数領域利用型の電子透かし、統計量を利用する電子透かしなどである。

○研究ライン2:提案手法を構成する基本解析方法についての調査と基礎モジュール作成
 ここでは、提案手法と比較対象手法について、後続する研究ライン5のための 基礎となる解析方法の研究およびプログラムやライブラリの作成を行った。 中心となる手法はFFT、DCT、ウェーブレットなどの周波数解析手法である。 また、スペクトラム拡散などの秘匿技術や研究ライン1で 扱った量子化誤差利用や統計量を利用する手法から、適応信号処理への適正などを 見て取捨選択を行った。
 結果として周波数変換後の値に対して透かし情報を埋め込む方法を選択した。 さらに、本研究の特徴としてパターン認識として透かし情報をとらえたため、 各種のパターン認識モデルについて検証した

○研究ライン3:コンテナの選択と提案手法の利用評価に関する調査
 電子透かしの対象となるコンテナには、濃淡画像、カラー画像、 ファクシミリ画像、動画像、音声、文書などがあるが、 ここでは提案手法が従来手法と比べて特長が発揮できるようなコンテナの選択と、 適切な透かし情報の利用方法についての調査を行った。
 結果として、先行研究が多く、また特徴情報の多いということで、多値カラー静止画像を透かし情報の 埋め込み対象とすることとした。

○研究ライン4:埋め込み手法に関する研究
 ここでは、研究ライン2、3を踏まえて、より具体的な埋め込み手法に ついての研究や議論を行い、周波数解析処理を行った後の コンテナのデータに、どのような適応信号処理を用いて秘匿情報を用いて埋め込むか、 つまり埋め込み位置の決定に関する最適な手法を検討するという研究ラインであった。
 調査を行っていくにつれ、透かし情報の抽出という作業をパターン認識の一種として 捉えることで、比較的に少ない埋め込み情報により透かし情報を復元できることを考え付いた。 そのときにおける最適な埋め込み位置や秘匿情報形態が、 コンテナの特性によってどのように変化するかについても研究を行っていった。

○研究ライン5:提案手法の実装と従来手法との比較
 ここでは、研究ライン2.3.4で 選択した提案手法と比較対象手法を実装、あるいはMATLAB上での処理を行い、 本研究の有効性の検証と比較優位が示される場合のコンテナと秘匿情報についての 特性の検査を行う。

○研究ライン6:論文の作成
 修士論文に関しては、 第1期で関連研究と論文のリファレンスの作成、第2期で提案手法と従来方式に 関連するアルゴリズムの調査結果をまとめ、第3期で比較評価の結果データを アーカイブし、第4期で総まとめを作成するという流れを予定していた。
 最終的には修士論文の雛型になる成果の発表を10月末の情報処理学会にて 発表することが出来た。また年度末の修士論文の作成をすることが出来た。


 研究スケジュールを通して意識したこととして、発表目標として10月末に行われた情報処理学会での発表と 年度末の修士論文作成があり、この二つに関して意識をしながら研究を進めていった。
 研究成果についてはあとに述べる、研究成果の節で詳しく示す。

研究の概要
 本研究では周波数領域にロバストな電子透かしを埋め込むことを目標とする。 ロバスト性とは透かしが埋めこめられたコンテンツに対して、どのような処理を施しても、 コンテンツに頑健に存在し続ける性質を持つ性質である。 これは著作権保護には透かし情報がいかなる処理が施されてもコンテンツに存在し続ける 必要があるため、ロバストな電子透かしについての需要が非常に高まってきたことが一つの要因である。
 また、本研究における透かし情報の復元には、非線形適応信号処理を用いた学習方法によって 構築されたネットワークの応答を用いいることで鍵自体の情報秘匿度を高度化する。 さらに、透かし情報自身は画像に対して 直接埋め込まれずに、学習に使った画像の特徴情報の位置情報が埋め込められる。 これはあらゆる処理を施しても、コンテンツから透かし情報が抽出出来ないことを意味する。 位置情報自身は透かし情報より、情報量が少ないため、少ない埋め込み情報に対して、多くの 情報を復元できることを意味する。

本研究で提案する手法の、手順は大まかに「埋め込み処理」と「復元処理」の二つに 分けることが出来る。それぞれの処理の流れは以下の通りである。

埋め込み処理
1.画像の周波数変換処理
2.鍵穴ブロックと鍵穴の位置情報埋め込みブロックの選定
3.鍵穴の位置情報の埋め込み
4.鍵の生成
5.画像の再構成

復元処理
1.画像の周波数変換処理
2.鍵穴の位置情報の取り出し
3.埋め込み処理4.で作った復号鍵を用いて透かし情報の復元


ここでは埋め込み手法について詳しく説明する。

 埋め込み処理1では、透かしを埋め込む画像に対して周波数変換を行なう。 本研究では離散コサイン変換(以下DCT)を用いている。 画像にDCTが行なわれると画像は細かいブロックに分割される。このブロックは 8*8画素で構成され、各画素値はDCT係数に変換がされる。量子化後の画素値を 埋め込み領域にする場合は、別途量子化を行う。

 埋め込み処理2では鍵穴ブロックと、鍵穴ブロックの位置情報を埋め込むブロックの 選択を行う。透かしを埋め込むのに必要となる「鍵」の生成処理の 学習に用いるブロックのことを本研究では鍵穴ブロックと呼ぶ。

 埋め込み処理3では、実際に鍵穴ブロックの位置情報の埋め込みを行う。 鍵穴ブロックをブロックA、鍵穴ブロックの位置情報を埋め込むブロックをブロックBとすると ブロックB内の画素のDCT係数に対してブロックAの位置情報を埋め込む。 このとき、埋め込まれる画素は、比較的にフィルタ処理などの影響を受けない 中間周波数領域の画素を選択する。この位置情報を透かし情報の埋め込み者は外部で保管する。

 埋め込み処理4では、透かし情報を復元するために必要となる復号鍵の生成をする。 本研究では鍵穴ブロックの特徴情報のパターン認識を行い、その応答を見ることで 透かし情報を復元をするため、ここでの鍵は厳密に言うとパターン分類器のことになる。 学習も出るとして、本研究ではニューラルネットワークを用いたバックプロパゲーション学習 を用いる。
 画像の特徴情報である、ブロックBの対角線上の画素の係数値を入力パターンとしたとき、 埋め込みたい透かし情報を認識できるように学習を繰り返す。 透かし情報の例としては10110101のようなビット列とする。 これは1バイトコードとなり、一文字埋め込むことが出来ることを意味する。 入力と出力は8と限定する必要はないが、DCT後のブロック分割が8*8画素になるので 本研究では入力を8、出力を8となるようなネットワークモデルを採用している。
 学習後の結合係数群を、パターン認識に必要となる分類器として、透かし情報の埋め込み者は 外部で保管するする。この分類器は透かし情報の復号に必要となる鍵となる。

 埋め込み処理5としては、位置情報が埋め込まれたコンテンツを画像に戻すべく 逆変換を行なう。量子化後の画素値を埋め込み領域にした場合は、逆変換の前に逆量子化を行う必要がある。

 JPEG圧縮に耐性を持たせるには、量子化後の画素値に対して埋め込むのが有効である。流れ図の説明には 以下にある図2を参照のこと。



図2.埋め込み手法の流れ



ここでは透かし情報の復元処理について詳しく説明する。

 復元処理1では、埋めこめられた画像に対してDCTを行ない、画素値をDCT係数に 変換する。量子化後の画素値を埋め込み領域にした場合は、量子化を行う。

 復元処理2では、外部で保管していた、鍵穴ブロックの位置情報を埋め込んだ位置情報を 元に、鍵穴ブロックの位置を特定する。

 復元処理3では、鍵穴ブロックの特徴情報を入力とし、分類器として外部で鍵として保管していた 分類器を用いて、パターン分離を行う。この場合、入力として正しい特徴情報が用いられ、 正しい分類器を用いれば、ネットワークの応答として透かし情報が出力されるという仕組みになっている。 復元処理の流れについては以下にある図3を参考のこと。




図3.復元手法の流れ



 本研究における提案手法を用いた場合、正しく透かし情報が復元できるかという評価実験1を行った。
以下の図4の通りとなった。



図4.評価実験1

 正しい鍵の組み合わせを用いた場合では、高い認識率を示したのに対して 正しくない鍵の組み合わせを用いた場合では、著しく低い認識率を示した。

 次にロバスト性の評価として、透かし情報が埋め込まれた画像にフィルタ処理を行った あとに透かし情報が認識できるかの評価実験2を行った。



図5.評価実験2

 ここでも、若干下がってはいるが、概ね高い認識率を示していることが分かる。

まとめ
 本研究の特徴として透かし情報の抽出処理を 非線形適応信号処理によるパターン認識問題として捉えた事と 特徴情報の信号が存在するブロックの位置情報のみの埋め込みによって 透かし情報の埋め込みと復元を実現することが挙げられる。
 このことは、少ない埋め込み情報に対して多くの情報を復元できることであり、 それは原コンテンツの劣化を最小限に抑えることが出来ることを意味する。

 また上記のような実験結果から、本研究の電子透かしの手法は、 画像の劣化を抑えながらフィルタへの耐性を向上することができ、 従来手法が取りうる鍵の組み合わせよりも本研究が用いる鍵の取りうる組み合わせが 圧倒的に大きいため復号鍵の秘匿性自身も高く、 少ない埋め込み情報に対して多くの情報を復号することが可能であることを示した


 本研究の成果として、情報処理学会 コンピュータセキュリティシンポジウム2003 (CSS2003)の 10C 電子透かし(3)の研究会に論文が採択された。
 また、この論文を基礎とし、修士論文の作成をすることが出来た。

今後の展望
 今後の課題として、静止画像の次世代圧縮手法のJPEG2000や、 MPEG4による動画像の圧縮手法では、周波数変換手法としてウェーブレット変換が 用いられている。そのため、ウェーブレット変換を用いた電子透かしの埋め込みを実現したい と考えている。
 また、パターン分離の汎化能力向上のためにバックプロパゲーションではなく Support Vector Machineの利用を考えている。
 さらに、本研究の特徴として、少ない埋め込み情報に対して多くの情報を復元できることに 着目し、ステガノグラフィーへの応用を検討している。