音声におけるニューラルネットワーク及び

統計量を利用した電子透かし

2005年度 森泰吉郎記念研究振興基金 研究者育成費 修士課程 研究報告書)

政策メディア研究科 修士課程2

久間大輔

あらまし 

本研究は埋め込み先コンテンツ(またはデータ、以下音声データ)の品質劣化を抑え、音声データ

の一部を抽出した場合でも電子透かしの抽出を可能とすることを目的としている。

本研究で提案する手法は大きく分けて二つに分けることが出来る。1つは音声データ

への必要な情報の埋め込み処理であり、もう1つは埋め込んだ情報を用いて著作者など

のデータを作る処理である。前者の埋め込み手法に関しては周波数を任意の幅に変換し

コンテンツ全体に対して周波数の一定の範囲にパッチワーク法を用いた手法を用いる。

後者に関しては教師つきニューラルネットワーク学習であるバックプロパゲーション学習を用いる。

この学習の入力としては埋め込み幅を、教師信号は著作権情報(電子透かしとして抽出したい情報)

として学習する。

 

キーワード  ニューラルネットワーク、電子透かし、パッチワーク法、音声

 

1.はじめに

 情報処理技術が活性化している現在、音楽や映像をはじめとしたデジタルメディアがインターネットを

通じての配信などがなされている。デジタルメディアは品質劣化しない複製が可能であり、著作権情報

の問題などが問われたがメディアファイルのサイズ、ネットワークが低速であることなどからあまり大

きな問題となってはいなかった。

 しかし、ネットワークの高速化、情報圧縮技術の目覚しい進歩にともなってデジタルメディアが著作権

を有する者の意図しない配信がなされてしまっている。その過程で著作権を誰が有するのか不明になって

しまうことも起こりうるため、新たな抑止力となりうる著作権管理のメカニズムとして電子透かしの開発

を行った。

 

 

2. アーキティクチャ

2-1 音声データへの情報の埋め込み

2-1-1 パッチワーク法

 パッチワーク法とは画像の電子透かしの手法として開発されたものである。自然画像において、2画素

間で画素値の差分を取り、これを自然画像中の多数の画素間において行うと0を中心に分布される。この

統計的性質を利用し、統計的に電子透かしの埋め込みを行う手法がパッチワーク法である。任意の2点を

抽出し、片方の値をδ増加させもう片方をδ減少させる操作を繰り返すことによって、自然画像から2δ

分差のある画像がえられ、先ほどの操作を行うと2δを中心に分布される。この差分を電子透かしとする。

 

2-1-2 パッチワーク法を利用した情報埋め込み

 パッチワーク法を利用して音声データに必要な情報を埋め込む。パッチワーク法の欠点としては電子透

かしを埋め込んであるということが誰にでも見て取れる、電子透かしが埋め込んであることはわかるもの

のそれ以外の情報の抽出ができないことである。そこで本研究ではそれらの点を改善した埋め込み方法を

提案する。

1.パッチワーク法では2点間の差をとる際、ランダムに選択していたが埋め込む範囲内において一定の

2.規則にしたがって2点の選択を行う。

3.周波数を任意の幅に変換する。

4.全体に対して埋め込まず、コンテンツ全体に対して一定の周波数の範囲内に埋め込みを行う。ここで

5.の埋め込みは音声データの劣化を抑えるため全体に対しての割合をできるだけ低く、耐性を高めるた

6.め必須な領域を選択する。

4.2で行った埋め込みを重ならないように複数回行う。1回以上であれば何回行ってもよい。

この方法によって埋め込みを行うことで電子透かしを埋め込んでいない音声データとの区別がつきにくく

なり、またコンテンツ全体に対して埋め込んでいることにより除去されづらくなる。さらに音声データへ

の劣化を抑えることができる。

 

2-2 音声データからの情報の抽出

2-2-1 バックプロパゲーション

 

 

 

 

 

 

 

 

 

 

 

 

 


図1 バックプロパゲーション

 

 

 

 

 

 

 

 

 


図2 パーセプトロンの入出力

 

 バックプロパゲーション[1][2]Rumelhartらによって提案された教師信号つきの学習型ニューラルネッ

トワークである。ニューラルネットワークのモデルは大きく分けて2つに分けることができる。1つはリ

カレント型[3]、もう1つは階層型である。リカレント型は各ニューロンが相互に結合しているリカレント

結合をもち、出力そのものではなくその過程に特徴がある。階層型はニューロンが階層構造を成している

ことであり、入力層に与えられた信号が各ニューロンのもつ結合の重み(結合係数)によって変換されな

がら最終的には出力層を経て出力される。バックプロパゲーションは階層型ニューラルネットワークに分

類され、誤差逆伝搬法を用いて出力層での誤差を入力層に向かって逆伝搬させ、ニューロン間の結合の重

みを変えながら望ましい出力を出すニューラルネットワークの結合を作る学習型のニューラルネットワー

クである。なお、パーセプトロンの入力は図2のように前層からの入力信号の和として扱われる。

 

2-2-2 電子透かし(抽出情報)の埋め込み

 2-1によって音声データに必要情報の埋め込まれた部位は、埋め込まれていない部位と比べると2点間の

差の分布が2δだけずれているはずである。埋め込んだ部位の開始箇所、終了箇所をそれぞれバックプロ

パゲーションの入力信号とし、著作者などの抽出したい情報を教師信号として学習を行う。学習の終わっ

た結合係数を鍵として電子透かしとする。鍵は音声データには埋め込まず、さらに鍵及び2-1によって必

要情報を埋め込んだ範囲及び周波数を変換した任意の幅を別途管理する。

 

2-2-3 電子透かしの抽出

 2-1によって埋め込みを行った範囲において任意の2点間の差分をとり、2δを中心に分布しているか確

認するとともに全体に対しても同様の処理を行い、0を中心とした分布かどうかを確認する。埋め込んだ

部位の開始箇所、終了箇所をそれぞれ入力信号とし、鍵として管理した結合係数を用いて出力を求める。

 

3 結果

3-1 必要データの抽出結果

 

 

 

 

 

 

 

 

 


図3                   図4

 

 

 

 

 

 

 

 

 


図5

電子透かしが埋め込まれているということが明確である点及び、電子透かしが埋め込まれていることがわ

かっていても埋め込み主がわからないという2点がパッチワーク法の欠点として挙げられる。そこで私は

パッチワーク法のみで用いるのではなく、ニューラルネットワークと組み合わせて用いることによって電

子透かしとしての強度をあげるとともに、タイムスタンプや著作権情報など抽出するべき情報量をどれだ

け増やそうとも元データへの影響は最小限のままかわらない本手法を開発した。

151396byte,352bps,3秒の音声データを対象として、パッチワーク法及び本手法での埋め込みを行った。

通常のパッチワーク法で埋め込みを行った結果が図1である。δ=0.01(1/100レベルでの埋め込み)で埋め

込みを行った結果、0.02を中心にした分布をみることができる。本手法を用いて埋め込みを行った結果

が図2、図3である。図2は全体での分布、図3は4箇所の埋め込みを行ったうちの1つである0.04-0.05

間の抽出を行った。その結果全体としては0を中心とした分布を得ることができ、埋め込みを行った部

分においては0.02を中心とした分布を得ることができた。

 

 


3-2 バックプロパゲーションによる学習及び透かしの抽出

  表1 必要データ及び著作権情報を用いて学習を行った結果

3-1において埋め込んだ必要データを用いて、著作権情報の埋め込みを行った。表1の通り4箇所に対し

て埋め込みを行い入力値とし、著作権データとしては私の名前を用いた。なお、学習に用いた中間層の

ユニット数は4である。その結果、1/1000までのマッチングが得られた。3-1において埋め込みを行った

範囲、教師信号、3-2において得られた結合荷重を電子透かし抽出の鍵とする。

 

4 今後の課題

 今後の課題としてはmp3などへの圧縮変換に対してのみではなく悪意のある攻撃への耐性の確認、透か

しの性質上通常の楽曲以外である効果音などの短い音声データへの埋め込み範囲の試行、鍵自体の埋め込みなどが挙げられる。

 

 

参考文献

[1]  Rumelhart,D.E.,Hinton, G.E. and Williams,R.J., “Learning representaions by back-propagating errors,” Nature, Vol323-9,  pp533-536, 1986

[2]  Rumellhart,D.E., Hinton,G.E. and Williams,R.J., “Learning internal representations by error propagation, in: D. Rumelhart, J. McClelland (Eds.), Parallel Distributed Processing: Explorations in the Microstructure of Cognition,” MIT Press, Vol1, pp319-362, 1986

[3] K. Smith, M. Palaniswami, and M. Krishnamoorthy, “Traditional heuristic versus Hopfield neural-network approaches to a car sequencing prooblem,” European J. Operational Res., Vol93, PP300--316