2009年度 森秦吉郎記念振興基金研究育成費 報告書

Key Generation for Damage-less Digital Watermarking using Neural Network
政策・メディア研究科博士課程
CIプログラム ノーベルコンピューティングプロジェクト所属
直江健介(naoe@sfc.keio.ac.jp)

研究課題

 "Key Generation for Damage-less Digital Watermarking using Neural Network"

 「ニューラルネットワークを用いたコンテンツ非破壊型情報ハイディングの鍵生成手法の提案」

研究背景と目的

 近年、インターネットや計算機の処理性能が飛躍的に向上してきたため、マルチメディアなデジタルコンテンツの作成が極めて容易になってきたという状況がある。また情報のデジタル化が進み、ますますデジタルコンテンツの公開や配布が簡単になってきた。そのため21世紀は情報の時代であるといわれている。これは普段の生活の中で扱う情報自身が持つ価値がこれまで以上に高まってきているということである。現在、デジタルコンテンツは多種多様なビジネスで利用されているが、デジタルという特性上、コンテンツの品質が優れているのにも関わらず、何度繰り返して複製を作っても品質の劣化が無く、取り扱いが簡単であるという特徴がある。今までは情報自体には形がないといっても、情報を記録するためには、紙、磁気テープ、メモリなどといった物理的な媒体が必要であった。それらの記録媒体を管理することで今までは著作権の管理や保護が行われてきた。しかしインターネットの普及によりこれらのデジタルコンテンツを公開することが可能になり、またコンテンツの量が数多く分散して公開されているため、記録媒体の管理による著作権の保護が大変難しくなってきた。デジタルメディアが登場する以前においては、著作物を複製、模写するために必要となった経費や時間、コピーをすることにより発生する品質の劣化というものが、著作物の不正コピーや不正使用といった行為の抑止力となっていた。デジタルメディアの登場以降、経費や時間、品質の劣化などといった問題が解消されたが、マルチメディアの高機能化による、ファイルそのものの容量の大きさが不正コピー等の抑止力となっていた。しかし昨今のMP3,JPG,MPGなどに代表されるファイル圧縮技術の進歩により、個人レベルでのファイルの入手、交換が容易に可能となってきた。そのため、これらのコンテンツが著作者の意図しない所で一人歩きすることもありえ、現実では他人の著作物を平然と複製し利用されるという可能性を常に抱えている。最近の事例では、P2Pアプリケーションなどを使った無許可なファイル共有や交換、ファイルやアプリケーションの不正利用やデジタルコンテンツの著作権侵害などが、多くの一般ユーザレベルでも行われていたという状況は記憶にも新しい。このようなことから、新たな抑止力となりうる著作権管理のメカニズムが求められ始めている。

 従来の解決策の一つとして、著作者の作成した情報コンテンツを一種の財産として扱えるように、著作権という権利が認められており、この法律を利用する方法がある。しかし、デジタルコンテンツの著作者が自分であると主張するためには、それらの著作物に署名を施す必要がある。今までマルチメディアの作品にはほとんど署名が施されていなかった。しかし現在のコンテンツビジネスのようなビジネスモデルが成長するためには、著作権の保護、主張、正当な課金、不正コピーの防止などの対策のために何らかの方法で署名などの情報をコンテンツに付与する仕組みを構築することが急務となる。このようなことから、悪意の第三者に、著作者の断りなくデジタルコンテンツが悪用されたり、不正にインターネット上を流通した場合、法的手続きをとるためにも証拠として、著作者情報などをコンテンツに忍ばせる電子すかしを中核とした、著作権を保護する新しい技術の登場が切望されている。その中でも電子透かしと呼ばれる技術が最近注目を浴びてきている。電子透かしとは、映像や音楽といったデジタルコンテンツそのものに、コンテンツの管理に必要な著作者情報などといった情報を、透かしとしてコンテンツに対して埋め込む技術である。この透かし情報は、埋め込んだ本人にしかわからない方法で、必要なときに透かしをコンテンツから抽出することで、著作権の主張や本物の証明などといった用途に用いる技術である。電子透かしは、絵画などの署名のように、目に見えるような形で埋め込む手法のものもあれば、人間の感覚器官による知覚が出来ない程度に、コンテンツに対して透かし情報をそっと埋め込む方法がある。しかし、どのような形で透かしを埋め込んだとしても、オリジナルのコンテンツに情報を付加するため、意図するオリジナルのコンテンツとはファイルサイズや見かけ上の変化などを伴ってしまう。この問題は特に、コンテンツがそのままの形で公開されることに意味がある、芸術作品のような著作物である場合において非常に重要な問題となる。そのため近年では静止・動画像などでは不可視、音声では聴覚不能な透かしを埋め込む技術が発展してきた。

 また、本研究では上述したような要件を満たすようなコンテンツ非破壊型情報ハイディングの鍵生成手法を提案することを主目的とするが、同じ仕組みを使うことでロバストなImage Hashing手法の提案が可能となる。そのため、本成果報告書においては、「静止画像におけるコンテンツ保護のための機械学習手法を用いたImage Hashing手法」についても議論する。

研究の内容

 本研究はコンテンツの品質劣化を伴わない新しい電子透かし手法の提案である。一般的に電子透かしでは埋め込み情報量は少ないにも関わらず、一定の量を埋め込む必要があったが、本手法では埋め込み情報をゼロにしている点が大きな違いである。これはコンテンツの質的変化を伴わないため、コンテンツの破壊がない手法となっており、幅広い応用が期待できるのが大きな特徴である。

 また本提案手法は新しい非破壊型情報ハイディングおよび情報抽出の性質を持つ。このことを応用することで新しいImage Hashingを実現した。本提案手法は対象とする静止画像を破壊することなく、バイナリビット列(認証情報、透かし情報、Image Hash)の生成および抽出を実現する。すなわち、従来の情報ハイディング技術では情報秘匿を行うために対象となる画像に情報を埋め込む必要があったが、本研究では機械学習手法を用いたパターン分類問題と捉えることで、学習に用いたオリジナル画像、あるいはオリジナル画像に改変が伴った画像から、オリジナル画像を必要とせずにオリジナル画像に意味付けた情報を抽出することが出来る。本研究ではこの抽出される情報を、画像を識別するImage Hashあるいはコンテンツを特徴づける固有情報とすることで、画像の識別、認証、類似度計量への応用を提案する。

 Image Hashingには従来のハッシュ関数のような、あるデータに対して一意のビット列を生成するものもあるが、人間の知覚的にほとんどオリジナルと変わらない圧縮された画像やフィルタ処理を施された画像をも同等のコンテンツと識別するために、このような画像の改変に対して耐性を持つものがある。この特性を持つものをRobust Image Hashingと呼び、本研究で提案する手法はこれに分類される。提案するImage Hashingはその特徴から、画像の識別に利用されることが多いが、抽出されたImage Hashからオリジナル画像と改変された画像との類似度の計量にも応用することが出来る。提案手法の詳細については参考文献(pp.46-61)を参照されたいが、鍵生成とImage Hash生成の概要手順としては以下の図に示した通りである。


Figure 1. Key Generation

Figure 2. Image Hash Extraction

 本研究では類似度を計量するschemeを提案した。そして、オリジナル画像に対して、著名なベンチマークツール(Stirmark)で作成した亜種画像との距離(類似度)を計量した。その結果を以下の表で示した。

Table 1. Table of Stirmark Test

 本研究では対象コンテンツに対して埋め込みを行わずに1)対象コンテンツのImage Hashの生成 2)非常に類似するコンテンツからは同じImage Hashを生成し、異なるコンテンツからは異なるImage Hashを生成 3)類似するコンテンツとの距離を計量するschemeを考案したことで類似度計量の仕組みを実現、それらをすべてを実現することが出来た。

研究の成果

 本研究で以下の学術成果をあげることができた。