2010年度において,倉林研究室(IMEL: Interactive Multimedia Enverimental Laboratory)では,動画像・音楽マルチメディアデータを対象とした検索・可視化・個人化システムの研究として,動画像検索エンジン,音楽検索エンジン,e-Books検索エンジン,スマートフォン専用のサーチエンジンへのクエリ入力支援機構を開発してきた.本研究成果である動画像・音楽対象感性分析は,「感性」という全く新しい視点からのコンテンツ流通を実現する“感性時系列メディア・ハブ機構”において,Web上に拡大する動画像,音楽データ,および,Webカメラ,スマートフォン内蔵カメラから獲得されるライブ動画像を対象とし,それらを多様なコンテキストを持つ時系列メディアデータとして捉え,印象特徴量分析による感性的コンテキストの自動抽出を行うものである.特筆すべき活動として,米国カリフォルニア大学サンディエゴ校(UCSD) Shlomo Dubnov准教授,米国ワシントン大学ボセル校Munehiro Fukuda准教授,スロベニア・リュブリャナ大学Ana Šaša博士,マルチメディア感性検索・自動配信システムの共同研究を行い,国際的研究ネットワークの構築,および,感性メディア分析・検索・配信の実利用環境を実現した.
- 成果1: 動画像・音楽データ対象アクティブ・感性マルチメディア配信を実現する統合システム・ソフトウェア“MediaMatrix”を構築し,オープンソース・ソフトウェアとして公開した(http://web.sfc.keio.ac.jp/~kurabaya/mediamatrix.html).MediaMatrixの機能として,180次元の色彩印象空間による2180 種類の色彩印象コンテキストを識別可能な動画像感性分析機構,および,西洋音楽における24調性に対応する24次元の音楽感性空間による224 種類の音楽印象コンテキストを識別可能な音楽感性分析機構を実現した.
- 成果2: 本システム実現に関する学術的成果として,1件の国際論文誌発表(査読有り),5件の国際学会発表(査読有り),および,6件の国内学会投稿(査読無し)を行った.特筆すべき成果として,研究代表者は,データベース分野における著名な国際学会であるDASFAA 2010において,実現したシステムに関するデモ発表を行い,Best Demo Awardを受賞した.
- 成果3: 米国カリフォルニア大学サンディエゴ校Shlomo Dubnov准教授,米国ワシントン大学ボセル校Munehiro Fukuda准教授,スロベニア・リュブリャナ大学のAna Šaša博士との間での感性時系列メディア・ハブの共同研究として,具体的なシステム構築を行い,1件の国際論文誌発表(査読有り),および,2件の国際学会発表(査読有り)を行った.
受賞
動画像・音楽マルチメディアデータを対象とした検索・可視化・個人化システムの研究に関する具体的なソフトウェア実装として,動画像・音楽データ対象アクティブ・感性マルチメディア配信を実現するシステム・ソフトウェア“MediaMatrix”を構築し,データベース分野における著名な国際学会であるDASFAA 2010(The 15th International Conference on Database Systems for Advanced Applications)において、Best Demo Awardを受賞し,国際的に高い評価を得た.
本システムは,動画像における時間軸に沿った色彩印象の推移を反映したメタデータ生成のために,動画像を任意秒数ごとの静止画像として抽出し,それら静止画像群を対象として,映像中の色彩情報を用いて感性特徴量を分析する機能を実現した.この感性特徴量分析機能では,印象を分析する時間的区間を表す単位時間の粒度を設定し,動画像における局所的な印象の変化(図1),および,大局的な印象の変化(図2)を,任意の粒度を用いて抽出することができ,動画像における感性的特徴点を抽出することが出来る.本システムは,これまで,感性的な視点からの情報獲得が困難であったストーリー性を有する時系列メディアデータを対象として,自動的な情報獲得を実現し,今後大量に蓄積される時系列メディアデータを対象として,個人の感性的嗜好に合致する対象の選択的自動配信環境を実現する,新しいメディア情報獲得・集約の可能性を広げるシステムとして位置付けることができる.
図1. 動画像ストリーム全体において支配的な 印象特徴量の時系列変化を可視化 |
図2. 動画像ストリームの特定箇所において局所的に 強い相関を示す印象特徴量の時系列変化を可視化 |
実現システム
ネットワーク上の時系列メディアデータを収集し,時間軸に沿った印象の変化を検出し,迅速なデータベース検索および分析機能群を起動し,自動情報配信を行うアクティブDB機能を構築した.本システムは,次の3機能を特徴としている: 機能1.既存の情報資源群を変更することなく広域的なアクティブDBシステム環境へ連結する機能,機能2.既存のマルチメディアデータベースを対象としてクエリ生成演算子を適用し,マルチメディアデータを組み合わせて,自らの検索意図を的確に反映した時系列メディア・クエリを生成する機能,機能3.時系列的な感性的内容を自動的に分析し、アクティブDBにおける検索機能、情報配信機能を駆動する機能.さらに,コンテンツ印象変化の可視化技術の開発として,大量の動画を対象とした感性分析・可視化機構の設計,実装を行った.さらに,ネットワーク上で複数の利用者が,自らの感性定義に応じて,メディアデータを分析・検索するためのWebサービスを公開し,慶應義塾大学SFCにおいて運用している(http://imelab.sfc.keio.ac.jp/MediaMatrixShare/).本システムは,動画検索サイトにおける各利用者の視聴履歴と感性メタデータとの連結により,各利用者に固有の感性的嗜好を抽出し,「ユーザが好むストーリーの流れ」や、「多くのユーザが連続して視聴する動画の並び」のような,新しい視点からの情報推薦を実現する.本技術は,各利用者の感性的嗜好を抽出した感性ポートフォリオを個人化感性空間として構築し,感性ポートフォリオを対象とした情報配信・推薦機構を実現し,動画・音楽データのみならず,広告や関連商品など,幅広い情報を配信可能とする(図2).本システムは,利用者毎に異なる色彩印象定義ファイル(色彩と印象語の関連性を定義するテーブルファイル)を格納し,利用者個人の感性に応じたメタデータ生成をオン・ザ・フライで行い,検索する.本システムを用いて、数百件の動画像データベース(各20分、全400万フレーム)を対象とした感性的嗜好に合致する対象の選択的自動配信環境を実装し、有効性の評価を行った.
図3.利用者のメディアデータの視聴履歴,および,利用者が有するメディアデータ群をコンテクストとして,各利用者に対応する個人化感性空間を生成し,利用者の感性的嗜好に応じた検索対象の自動分析,および,関連性計量を実現