2014年度森泰吉郎記念研究振興基金成果報告

非対称ソーシャルネットワークの特性を活かした伝達システムの構築

慶應義塾大学大学院 政策・メディア研究科 後期博士課程
小島清信

背景と目的

情報共有に関わる代表的なインターネットサービスの変遷を図1に示す。 インターネット上の検索エンジンや情報交換サービスを介した情報共有システムにおいては、 データを蓄積して活用するストック型システムが広く利用され、 利用者の履歴や状況に合わせて提供情報を変化させる個人化により利便性を向上してきた。 さらに、人を介した伝搬の課程で情報を収集、選択するフロー型システムが広がってきたが、 特に近年、ストック型における行き過ぎた個人化が情報の偏りを生む懸念が広がり、 フロー型に対する期待が高まっている。 フロー型はさらに、 友人関係のような相互リンクによるソーシャルネットワークと、 情報伝達のために選択的に購読先を選ぶ非対称なソーシャルネットワークに分類できるが、 本研究では後者に着目し、 多様な視点に基づいた情報共有を目的として、 ソーシャルメディアの構築と評価を行った。


   図1. 情報共有サービスの変遷

Twitter における非対称リンクの選択行動

フロー型における情報伝達の特性は人に依存しており、 もし人が迎合的な行動をとれば多様化を阻害することになるため、 多様性の検証のために人の行動分析が重要となる。 まず、情報伝達のための最大規模のソーシャルネットワークを構成するTwitter について、 ソーシャルグラフの動的変化を分析した。 Twitter が急成長を始めた2010年から調査を始め、 サンプリングした172,000 個のアカウントから言語の属性が日本語に該当する6,967 ユーザを抽出し、 2週間ごとのリンクの変化を観察することにより、それまで注目されなかったリンクのつなぎ換え行動を分析した。


図2. 分散的選択と探索的選択

Twitterユーザが選択するフォロー先の特性を図2に示す。 横軸にフォローするユーザの購読者(フォロワー)数をとり、 サンプリングされたユーザについて有名人を指向するか一般人を指向するかの分布がわかるよう、 平均フォロー数を縦軸にとっている。 フォローする数が多くなるするようになると特性が変化するので、 フォロー総数ごとに7つに分けてプロットしている。 一般的なソーシャルメディアに見られる優先的選択と呼ばれるモデルでは、 この選択の分布はフラットとなる。 Twitterにおいては、1〜3人をフォローしているユーザ(赤色)は分布がほぼフラットであるが、 加入時に有名人のフォローを勧めらる影響で 105.5のフォロワーを持つ有名人の割合が高い。 フォロー総数が増えるとこの層へのフォローが多少は増えるが、 動的分析ではこの層へのリンクは頻繁に削除される傾向があった。 Twitterのようなプッシュ型のサービスでは、皆が入手できる情報は、 様々な経路で流れてくるために直接フォローする価値が低下する。 一方で、フォロー総数が増えたユーザでは数百人のフォロワーを持つユーザへのリンクが増え、 アンケート分析と合わせて、 積極的に情報ソースを取捨選択しながら、他で入手しにくい情報を得ようとしていることがわかった。 Twitterでは優先的選択に加えて、 利用者が習熟するにつれて高次数のユーザへのリンクを見直し、より低い次数を選択する「分散的選択」と、 自分に適合する情報を伝達する中次数のユーザを選択する「探索的選択」という 2つの行動パターンがあることを初めて発見した。 前者は情報ソースの多様化を、後者はコンテンツの深さをもたらすことになり、 フロー型メディアがポテンシャルとして持つ多様性を明らかにした。 ただし、Twitterにおいては、 過去に評判の良かったテーマに沿ったツイートに偏りやすく、 トピックの多様性が必ずしも確保されていない。

興味の抽出を目的としたTokenCastシステムの実装と評価

利用者が状況ごとに持つ様々な興味を共有することにより トピックの多様性を動機づけるため、 人を介して興味を集約するコンテクストランキング機構を開発し、 新たなソーシャルメディアとしてのTokenCastシステムを構築した上で、 企業や大学内の講演会など、12イベントで検証を行った。 ハッシュタグに用いるような短い文字数で、 参加者の興味のあるトピックを共有することで、 講演者や参加者に多様な視点を提供することを目指した。


図3. コンテクストランキングの表示画面例

図3にコンテクストランキングのメイン画面を示す。 参加者が興味を持ったトピックについて①に20文字以内で入力するか、 他の参加者が登録することで一覧表示されている②のトピックの中から選択し、 ③のボタンで “投票” することでシステムに登録される。 参加者の興味を集めたトピックが随時②の一覧の中で上位に大きな文字で表示され、 最大で10個のトピックを表示する。 誰かが投票すると、時間経過と共に忘却曲線のように減衰する評価値をトピックごとに合算して順位を決める。 Twitterやチャットで投稿を共有する際に用いられるタイムラインと呼ばれる投稿一覧では、 本題から逸脱する投稿の氾濫が課題になるが、 興味のあるトピックを入力する仕組みと相互投票の仕組みを一体化することにより、 既に類似の投稿トピックがある場合の重複登録を防ぎ、 投稿が集約されるために、多様な視点に基づく投票を容易に把握できる効果を示した。


図4. 評価値の遷移

図4にトピックごとの評価値の遷移例を示す。 通常は集中的投票例に示すように、講演の話題に上ったトピックに対して短期間に投票が集中して評価値の合算値が一気に上昇し、 順に次のトピックへと興味が移っていくが、 継続的投票例(青色)が示すように、単発の投票が10分以上にかけて継続するトピックがあり、 発表資料中で説明のなかったキーワードや、上位の概念、参加者の提案など、 すぐには価値に気がつかないトピックがこれに該当した。 このように人によって興味を高める時間が異なる場合でも、探索的な投票の連鎖を通じて、 興味を高めるのに時間がかかるトピックをあぶり出す現象を「共振現象」と名付け、 参加者が多く、複数のテーマを扱う6つのイベントにおいて、 投票数の上位にあるトピックのうち22%がこの現象に該当することを確認した。 共振現象は、参加者が興味を持つトピックの多様化に寄与し、 これを共有することにより発信者の視点の多様化を導く。

人を介した情報の集約処理

TokenCastにおける集約効果や共振現象について、従来ストック型で行われる処理や、 従来のチャットシステムにおける投票と比較する。 図5(a)に模式化して示すが、従来のストック型で皆の興味の傾向を分析する場合、 自由記述した投稿について、 予め集合知などにより構築された辞書を用いた内容解析により話題を抽出し、 イベントの場の特徴から、その場で重要な話題を提示することが一般的であった。 辞書や与えられた情報が十分であれば、適切なものを提示するかも知れないが、 それまでに類似のない内容の投稿の判断は難しい。 図5(b)に従来のチャットシステムにおける投票の場合を示すが、 投稿の各々に対して人が重要度を判断するため、 発信者の投稿をすべて把握して判断する負荷が高かった。 本システムでは、図5(c)に示すように、発信者自身が処理ロジックの中心になる。 図3にあるように発信者と投票者に区別はなく、 ランキングを提示された投票者が、新規の表現を登録するか、 既存の表現に投票をするかを判断する。 辞書は予め作るのでなく、リアルタイムに更新されるランキングリストがその場で生成される辞書にもなるし、 参加者に提示される内容にもなる。 コンテンツランキング機構は内容の解釈等はせず、 人の行動をサポートする役目に徹することで、(b)に比べて投票者の負荷も大きく低減し、 かつ、その場での新たな視点での表現が辞書に制約されることなく扱える。 アルゴリズムと人の界面を変えることで、人が扱う情報量は減って負荷が減り、 アルゴリズムが担う処理も大きく減る効果を得た。 さらには、常にランキング中の項目の価値判断を継続することによって、 発見的な投票を促し、共振現象を導いた。


図5. 人を含む処理系

結論

TokenCastの機構は、人を処理系の中心に置くことにより、 言語解析や推薦エンジンと集合知の組み合わせでは実現できない広い範囲のトピック抽出と集約を可能とした。 この機構とTwitter における分散的・探索的選択と組み合わせることにより、 コンテンツの広さ、深さと情報ソースの広さを併せ持つフロー型の情報伝達メディアを構築できることを示した。 フロー型ソーシャルメディアに対する情報の多様性に関する期待はあっても、 これまでその特性は明らかにされてこなかった。 本研究は、TwitterおよびTokenCastを通じて多様性に関するユーザの行動を多面的に明らかにし、 人が積極的に関わることで多様性をもたらす情報共有システムの発展に寄与する。