2005年度 森基金報告書

研究課題名:オンラインコミュニティ意味内容調査システム開発

グループ研究:テクスト意味空間分析システム開発

大学院プロジェクト「ソシオセマンティクス工房」(深谷研究会)では現在、SFCにおいて文部科学省の21世紀COEプログラムに採択された「日本・アジアにおける総合政策学先導拠点」の研究グループとして資金援助を受け、Web社会調査法の開発に重点を置きながら活動を行っている。2005年度は「テクスト意味空間分析システム」のメジャーバージョンアップのための設計開発を軸として活動を進めた。

「テクスト意味空間分析システム」とは、文法理論に基づく意味のまとまりをテクストデータから抽出し、統計処理を行う、自然言語処理技術を用いた新しいテクストマイニングツールである。テクストデータからの分析作業は最終的には分析者の解釈によるものとなるが、そういった分析者の解釈を体系化すること、利便化することを本システムの目的としている。活動としては、毎週火曜日に富士ゼロックス研究所(FX PAL JAPAN)から研究者を招いての定例ミーティングを実施し、深谷教授、および院生・学部生を含むプロジェクト参加者全員と、企画・要求分析・設計・実装・事例分析・プロジェクト進行管理を含む打ち合わせを行っている。2005年度はバージョンを刷新したバージョン2の設計を一からやり直し、プロトタイプの実装までに至った。秋には、「SFC OPEN RESEARCH FORUM 2005(ORF2005)」において成果発表を行い、学術・ビジネスの各方面から多数の好評価とフィードバックを得、次期メジャーバージョンアップのバージョン3開発に向けた指針を得ることができた。

また、学部研究プロジェクト(深谷研究会)においても、ソシオセマンティクス工房と合同するかたちでプロジェクトについての発表・議論を行ったほか、理論的な基礎付けとして、社会学における意味理論の文献輪読を進めて隔週で発表を行うワークショップを行った。

個人研究:オンラインコミュニティに適した意味分析手法の開発

個人研究としては、「テクスト意味空間分析システム」を用いたオンラインコミュニティの分析と、オンラインコミュニティに適した意味分析手法としての、話題の連なりとしてのコメントチェーンの構造分析と意味内容分析とを融合した分析手法の開発をテーマとしている。

2005年度はオンラインコミュニティを対象とした事例分析を行い、システムが有効であることを確認した。また、システム開発と事例分析の成果を修士論文にまとめた。

修士論文テーマ

意味解釈支援アプローチによるオンラインコミュニティ分析手法の開発

論文要旨

 本研究の目的は、大量のテクストを対象とする社会調査に適したテクスト分析システムを開発し、オンラインコミュニティを意味内容に踏み込んで調査する手法を提示することで、意味の視点を重視する社会研究やマーケティングに有意義な示唆を与えることである。

 テクストを主要な媒体とするオンラインコミュニティの隆盛により、社会調査やマーケティングの対象として利用価値のあるテクストデータが豊富に出現している。こうしたテクストに表出された人々の生の声(意味世界)を知るには、大量のテクストの意味内容を読み解くための調査分析の手法が不可欠である。しかし、テキストマイニングを代表とする既存の大量テクストの分析手法は、意味内容に踏み込んで分析を行う手法としては不十分であった。(第1章)

 その事実を、オンラインコミュニティを対象とする分析でも具体的に確認するために、既存のテキストマイニングの手法を援用した掲示板分析サイトを構築した。結果、やはり大量のテクストの意味内容を読み解く手法としては不十分であることがわかった。(第2章)

 そこで、テクストの意味内容調査に必要な条件は何であるかを具体的に検証した。結果、「システムが解析し、人間が解釈する」という意味解釈支援アプローチを用いた分析システムが必要であることが明らかになった。(第3章)

 これを受けて、意味内容を解釈しながら大量のテクストを分析できるシステムTextImi(テクイミ)を設計し、開発を行った。結果、マーケティング調査のテストケースで有効に機能することが示された。(第4章)

 そしてオンラインコミュニティに対してもTextImiを活用した事例分析を行い、大量のテクストを対象とする意味内容調査が効果的に行えることを示した。(第5章)

キーワード

1. テキストマイニング 2. 自然言語処理 3. 社会調査法 4. マーケティング 5. オンラインコミュニティ