2012年度森泰吉郎記念研究振興基金「研究育成費」研究成果報告書


名前:橋口恭子
所属:政策メディア研究科 修士課程2年

研究課題名

見た目の情報を元にした検索方式「かわいい検索」とその応用

研究概要

近年ブログ記事に絵文字や顔文字、ひらがなを多用し行間を大きくあけ、文章と共に写真で記事を飾る「かわいいブログ記事」が数多くみられるようになった。女性は顔に化粧をする行為と同様に、ブログにも「絵文字」「顔文字」「行間」「ひらがな」などの化粧を施し互いにコミュニケーションを図っている。このような現象は女性が文字を崩す事によって生まれた「万葉がな」が生まれた時代から続く女性独特の文化である。  しかし、これまでのブログ検索方式では、「行間」「絵文字」「顔文字」に代表される「崩されたかわいい文字」は加味しておらずかわいいを探す検索方式としては適合していない。そこで、本研究では、女性に特徴的なブログ記事の書き方と、かわいいを構成する要素に着目し、ブログ記事の見た目を元に所望のキーワードの情報を探す事ができるかわいい検索エンジンの提案をし、実装を行った。  まず、ブログ記事のかわいさを調査する予備実験の結果から「絵文字」「行間」「ひらがな」「顔文字」などの12の要素がかわいいブログ記事に特徴的な要素である事がわかった。次に、それらの要素と因子分析の結果を用いてブログのかわいい書き方を「ゆるかわ」「キュート」「きれい」「おもしろ」「まじめ」の5種類のかわいいタイプに分類する判定式を作成した。 最後に、ブログ記事の見た目を元に所望のキーワードの情報を探す事ができるかわいい検索エンジンの実装を行いgooラボ上で実験を行った。ブロガーのかわいいタイプと世代の分析、検索キーワードと行動分析、ユーザの行動分析、ユーザの動機分析を行った結果から、かわいい検索は、「物語を創出する物語検索」、「世代を分ける雰囲気検索」「リアルと繋ぐファッション、人名、食べ物検索」として有効である事がわかった。

かわいい検索TOPページ

かわいい検索検索結果ページ

研究目的と研究方法

本研究の目的は、ブログを見た目のかわいさから判定し、所望のキーワードが含まれるブログ記事を検索する事のできる「かわいい検索」を作成する事である。 まず、現代ブログに現れたかわいい「文字の書き方」を捉えるために、ブログ記事の「かわいい」とは何か、「かわいい」を構成する要素と「かわいい」ブログの種類を調査する。 次に、調査の結果を用いて、ブログのかわいさの違いを判定する計算式を作成する。最後に、かわいい検索を実装し、gooラボ上で実験を行う。

かわいいタイプの計算式

一言に「かわいい」と言っても、エロカワ、キモカワなどの言葉や、雑誌にもすみわけがあるように、「かわいい」には多用な種類があると考えられる。 そこで、かわいい検索を実現するために、まず、ブログ記事のかわいい要素とは何か調査した。調査の結果「絵文字」「顔文字」「行間」などの12の要素と 「ゆるかわ」「キュート」「きれい」「おもしろ」「まじめ」の5種類のかわいいタイプが選ばれた。次に因子分析を利用して判定式を作成した。

かわいい検索のシステム構成

(1) ブログ記事をクローリングする

まずブログ記事のクローリングを行う。 読者モデルの記事を中心にクローリングするブログのトップページをあらかじめ手動で設定した。 その後そのブログに含まれる全ブログ記事を収集する。現在 1500 件のブログが登録されており総記事数は約160万件である。 クローリングの頻度は、1日一回行う設定になっている。

(2) かわいい判定を行う

  次に、クローリングしたブログ記事に対してかわいい判定を行う。 ブログ記事のコンテンツは、各ブログで指定された CSSやhtmlのタグを用いる事で取得する 。ブログは、yahooブログ、楽天ブログ、zipper、amebaブログ、はてなブログ、テレビ東京、ライブドアブログ、nonno、so-net、yaplog、starstudio、excite、seesaa、nifty、laff 、fcblg 、fc2、cancam、独自ドメインの全部で21件である。 かわいい検索では最終的に記事ではなく「ブログ」に対してかわいいタイプの決定を行う。最新記事30記事分のかわいい判定をし、5種類のかわいいタイプの全スコアを足した値のうち、最大の値をとるかわいいタイプをそのブログの判定とする。その事でブログ記事の書き手がどのかわいいタイプの人であるかを判定する事ができる。ブログに対するかわいい判定は定期期間毎に更新される。  かわいいタイプのスコアが同点だった場合、優先順位を決めている。優先度が高い順に、「おもしろ」「きれい」「まじめ」「キュート」「ゆるかわ」の順番にしている。例えば、「ゆるかわ」のスコアが3、「おもしろ」のスコアも「3」の場合、このブログは「おもしろ」に分類される。これは検索エンジンを汎用化させていく過程でより「かわいい」記事であると考えられる「キュート」「ゆるかわ」のブログ記事の精度を高める為に設定した。

(3) 検索結果に表示する

検索者がキーワードを入力すると、そのキーワードを含むブログ記事とかわいいタイプの情報をデータベース から取得し検索結果に表示する。検索結果は更新日時順に表示する。特に「かわいい」には流行があるため、 最新記事を見たいという検索要求の需要が大きかったためこのような設定をした。  

システム構成図

実験

作成したかわいい検索を用いて、gooラボ上で実験を行った。 かわいい検索は、世界じゅうで利用されていた。特に、韓国中国などが多かった。 これらの大規模な検索データを利用して、ユーザーの検索行動の分析を行った。分析方法は下記の3つで行った。

(1)ユーザーの検索行動の分析

(2)かわいいタイプと検索行動の違い

(3)検索行動の動機分析

結果と考察

実験の結果かわいい検索のユーザーは「ゆるかわキュート」「きれい」を行き来する事によって、自分の欲しいレストランやファッションアイテムを見つける検索行動がみてとれた。 その中で「かわいい」を見つける新しい出会いがある事がわかった。 また、5つのかわいいカテゴリの中で読者モデルと「リアル」な自分と比較する検索行動がみてとれた。これらの事からかわいい検索のユーザーは、自分でかわいいという物語を作っていると言える。

今後の課題

1.かわいい検索を商品化する事

→カフェの検索、ラーメン検索などで応用し商品かを図る。

2.かわいいの定義やかわいいのタイプが変わる。

→機械学習のアルゴリズムを用いてかわいい判定式の精度の向上を図る。

かわいい検索の応用

かわいいカフェやレストランを探す事の出来る、「cafepalette」を作成した。
URL:http://www.curioswitch.org/cafemap
id:cafemap
pass:cafepare

具体的な成果

①修士論文の執筆

②橋口恭子, 木川真理, 小川克彦: かわいいカフェの検索システム「CafePalette」の研究, エンタテイメントコンピューティング研究会, 情報処理学会, Vol.2013-EC-27 No.20, 2013-3.

③ORFでかわいい検索の応用例である「cafepalette」の発表を行った

参考文献
[1] C. Lindahl and E. Blount, “Weblogs: simplifying web publishing,” Computer, vol. 36, no. 11, pp. 114–116, 2003.
[2] 山根一眞, 変体少女文字の研究―文字の向うに少女が見える. 講談社, 1986.
[3] アクロス編集室, ヘタウマ世代―長体ヘタウマ文字と90年代若者論. PARCO出版, 1994.
[4] 宮台真司, サブカルチャー神話解体―. PARCO出版, 1993.
[5] Seventeen. 集英社.
[6] 丸谷才一, 書きたい、書けない、「書く」の壁 (シリーズ日本語があぶない). ゆまに書房, 2005.
[7] 速水健朗, ケータイ小説的。. 原書房, 2008.
[8] 荻上チキ, セックスメディア30年史欲望の革命児たち. 筑摩書房, 2011.
[9] 四方田犬彦, 「かわいい」論. 筑摩書房, 2006.
[10] 新村出, 広辞苑, 第六版. 岩波書店, 2008.
[11] CREA(クレア), 1992年11月号 ed. .
[12] 読売新聞新日本語企画班, 新日本語の現場. 中公新書クラレ, 2003.
[13] 真壁智治, カワイイパラダイムデザイン研究. 平凡社, 2009.
[14] 速水健朗, ケータイ小説的。. 原書房, 2008.
[15] 藤村考, “ブログRAGNER TGに装備されたブログマイニング技術と可視化技術,” 電子情報通信学会技術研究報告. AI; 人工知能と知識処理, vol. 108, no. 119, pp. 57–62, 2008.
[16] 藤村考, 戸田浩之, 井上孝史, 廣嶋伸章, 片岡良治, and 杉崎正之, “マルチファセット型ブログ検索システムBLOGRANGERの開発,” 信学技報, vol. 105, no. 650, pp. 19–24, 2006.
[17] 戸田浩之, 藤村考, 井上孝史, 廣嶋伸章, 杉崎正之, 片岡良治, and 奥雅博, “目的指向型ブログ検索システムブログRANGERの提案およびユーザ評価,” 情報処理学会論文誌, vol. 48, no. 14, pp. 132–151, 2007.
[18] 森本和伸, 林貴宏, and 尾内理紀夫, “Mine ブログ:興 味発見を支援するブログ記事推薦システム,” 社団法人情報処理学会, vol. 47, no. 4, pp. 1171–1180, 2006.
[19] 高瀬賢一, ウケるブログ―Webで文章を“読ませる”ための100のコツ. 技術評論社, 2005.
[20] 岩田, 荒瀬, 原, and 西尾, “子供によるWeb検索のための検 索結果リランク手法,” 情報処理学会論文誌, vol. 52, no. 3, pp. 1055–1068, 2011.
[21] D. Child, The Essentials of Factor Analysis. Continuum International Publishing Group, 2006.
[22] J. Nielsen and T. K. Landauer, “A mathematical model of the finding of usability problems,” in Proceedings of the INTERACT ’93 and CHI '93 Conference on Human Factors in Computing Systems, 1993, pp. 206–213.