2000年度人工知能学会全国大会(第14回)論文集, pp.281-284, 2000
小林郁夫† | 尾崎知伸† | 古川康一† | 今井むつみ‡ |
Ikuo Kobayashi | Tomonobu Ozaki | Koichi Furukawa | Mutsumi Imai |
慶応義塾大学大学院 政策・メディア研究科†
慶応義塾大学 環境情報学部‡
Graduate School of Media and Governance, Keio University
Faculty of Environmental Information, Keio University
abstract: We have developed artificial models of a vocabulary learner supported by a theory of constraint in naming suggested in cognitive psychology. The method of Inductive Logic Programming provides a good formalization for this problem. In this article, we suggest a new model to deal with a hierarchy of concepts because of importance of ontological development in concepts' learning. To let the model develop a concept hierarchy, we introduce criteria by which each of objects is decided to be dealt with as a positive, negative or `neutral' example in concept induction for the correspondent label. The criteria are from two evidences; one is the constraint by the hierarchical relations between concepts, and the other is the similarity in shape.
1 研究の概要我々は,「語彙の制約」[ 5, 3] などの認知心理学の成果に 基づき,論理プログラミングによる幼児の名詞語彙獲得に関する研究を行って いる[ 2, 4 ] .その際,入力である`` ラベル''と``事物'',およびその``属性情報''を,帰納論理プログラミングに おける``クラス'',``事例''および``背景知識''にそれぞれ対応づけることで, 言語獲得の問題を帰納推論の問題として定式化している (図1}). このモデルでは,ある一つの事物とラベルの組が与え られる度に,(1)そのラベルすなわちクラスに関する概念を獲得する,(2)得ら れた概念,もしくは与えられるラベルと事物のペアが,既得の概念と矛盾する 場合には,帰納のやり直しや,階層的関係,排他的関係の導入により,矛盾を 解決する,という処理が行われる.すなわち,ラベルと事物の組を与えてから, 概念の獲得や修正などを行い,次のラベルと事物の組が与えられる準備が整う までが一単位として扱われ,本論文ではこれをセッションと呼ぶ.各セッショ ンの冒頭で与えられる事物とラベルを,そのセッション中はそれぞれ刺激事物, 刺激ラベルと呼ぶ.また,ある概念の上位概念とは,その概念の直接の上位概 念だけでなく,その直上の概念の各上位概念も含む.これは,下位概念に関し ても同様である. さらに,一般には,事物に関する属性情報としてあらゆるものを考えなければ ならないが,現在のモデルでは,認知心理学の研究成果に基づき,形状,材質, 色 などの主に視覚的情報だけを扱うことにしている.
本論文では,これまでに構築したモデルに対し,類似度による概念間の関係の 判断が,それ以降の学習に影響を及ぼすような機構を追加する.
以下に本論文の構成を示す. 次章では,個々のラベルの帰納的学習において,どの事物を学習目標に対する 正負事例として選びだすかについて論じる.うち第1節では概念階層,第2節で は目標ラベルと事例候補の事物との類似度を利用することを提案し,第3節で ラベル-事物間の類似度の計算に必要な事物-事物間の類似度の計算を定義する. さらに章を改めて,各セッションでの学習の全容を示し,その中で概念階層の 構築について略述する.終章で遺漏を補う.
2 個々のラベルの帰納的学習における事例の設定
図1:個々の語の意味の獲得の帰納モデル言語獲得においては,各ラベルに関する負事例が明示的に与えられることは期 待できない.したがって,何らかの方法でラベルに対する負例を設定する必要 がある.ここでは,階層関係の利用と類似度の利用による事例の設定方式につ いて説明する.
2.1 階層関係にあるラベルの正負事例の利用あるラベル l1 を帰納的に学習するとき,図2に示 すように,事物 o1,o4 が l1 にとっての正事例であるべきだという刺激があっ たか,後述の類似度計算によってそのように判断されたとする.また,同じく 類似度計算によって事物 o7 が負事例であるべきだと判断されたとする.また それまでのセッションの積み上げの間に,別のラベル l2 が l1 の上位概念と 仮定され,l2 の正事例として事物 o1,o2,o3,o4,o5 が,負事例として事 物 o6 が負事例であるべきである場合,上位の概念が被覆しないものを被覆す ることはないと考え,o6 を負事例とする.
同様に,それまでの過程で l1 の下位概念と仮定されたラベル l3 のその時点 における仮定の正事例が o1,o2 であり,負事例が o7,o8 であるとき,下位 の概念によって被覆されるものを被覆しないことはないと考え,o2 を正事例 とする.
2.2 事物と既知ラベルとの距離の利用
図2:概念階層を利用した正負の事例の付与階層概念の利用による正負事例の設定は,概念階層が理想的な状態である場合には 有効であるが,言語獲得の途上において,この仮定が成り立つとは限らない.した がって別の方法で事例を設定する必要がある.
2.2.1 距離の計測法とそれを用いた正負の判断以下の条件を満たす事物を対象に,ラベル概念の学習における正負事例の設定を行 う.
上記の条件を満たす事物について,各々,目標のラベルとの類似度を計測する. 類似度は距離の形式で計算する.よって,より似ているものが数値が小さく, 同一のもの同士の類似度を計測すると0となる(式2).この数値をラベルの ``一般性'' によって正規化した値(式1)がある値 以上のものは負事例,別のある値以下のものは正事例とする.また両数値の中 間にあたる類似度距離にあるものは中立として,帰納では無視する.
- 当該ラベルに被覆されているがそのラベルとの関連づけを既往セッションの 刺激中で提示されていない事物
- 当該ラベルとの関連づけを既往セッションの刺激中で提示されているが, そのラベルに被覆されていない事物
ただし,ラベル概念は変化の過程にあり,また本来,事物とは別の次元に属する 比較不可能なものであるので,
を利用し,ラベルと事物の距離を計算する.すなわち,
- 当該ラベルに被覆され,かつそのラベルとの関連づけを既往セッションの 刺激中で提示されている事物
ただし, obji, objj, objk∈S(l)
S(l) = ded(l) ∩ link(l)
ded(l) = {objn | l の概念が objn を被覆}
link(l) = {objn | l と objn は既往セッションの刺激中で関連づけられている}
ACB : 大きさ Aの集合からB個の要素をとる組み合わせの数
card(A): 集合Aの要素の数
となる.式1で示すように,ラベルと境界的な事物との類似度は相対的である. より多様な事物と関連づけられ,より多様な事物を被覆し,その両者がより高 い割合で重なりあっているラベルほど,より多様な境界的な事物を正事例とす る.2.3 事物間の類似度距離
上述のように,ラベルと正負の振り分けを決定したい事物との類似度の計算に は,事物間の類似度距離が利用される.ここでは,「形状類似性バイアス」 [3] を考慮し,重視する形状に関係するクラスの記述子に関わる計算 を第1項で,それ以外のクラスの記述子に関わる部分の計算,および両者から 導かれる事物間の類似度を第2項で記述する.
2.3.1 内包の形状記述部事物の形状は,ある対象が事物の ``部分である'' ことを示す述語,それらの ``部分の形状'' を表現する述語,および各部分同士が ``隣接しているか否か'' を示す述語から成り立っている(図4左側参照). ``隣接'' の情報から図中央のようなグラフ表現を導く.事物の部分はグラフ の節点として表現される.
このグラフに,多くの隣接節点を持つ節点から順に番号を振る.隣接する節点 の数の等しい節点が複数ある場合には,隣接する節点のさらに隣の節点(距離2 の節点)の数の合計を調べ,多い方を選択する.例えば図 4右側の o3 において,so7,so8,so9 はいずれも隣接節点の数が 1 で あるが,距離 2 の節点のの数の合計は,so7 と so8 が 2 であるのに対し, so9 では 1 である.距離を伸ばして比較しても同じである場合には,部分の 形状自体の類似性を 図3に示すような階層から調べ,より類似した 節点を選択する.たとえば o2 の節点である so1 と so3 は o3 の 2 番であ る so5 と比較され,形状の上でより類似している so1 が 2 番に選ばれる. so7 と so8 についても同様に so3 との類似度で優先順位が決まる.
図3:形状のオントロジーひとつのグラフからふたつの節点をとってくると,隣接している場合とそうで ない場合がある.このことを利用して,事物間の類似度をはかる(式6).両事 物で i 番目と j 番目の部分が共に隣接しているか,両事物ともで隣接してい ない場合,0 を,片方の事物で隣接していてもう一方で隣接していない場合 1 を累算する.各事物の部分の数は互いに異なるので,i 番目と j 番目の両者 が片方の事物で揃っていない場合がある.この場合,その事物では i 番目と j 番目が隣接していないものとみなす.
さらに,同じ番号をもつ部分同士の類似度距離を累算(式7)して内包の形状関 係クラスの類似度距離(式5)を完成させる.事物の部分同士の形状上の類似度 距離は,最も特殊な共通の形状クラスの階層のレベルで判断する. ``cylinder'' と ``frustrum'' の間の距離は,双方の共通クラスである ``conoid'' の階層レベルが 2 であるので,2 の 2 乗分の 1 ,すなわち 1/4 となる.双方が同じ表現である場合,距離を 0 とする.また,一方の事物の 部分に対応する部分がもう一方の事物にない場合,距離を 1 とする.
このようにして,図4の事物 o2 と事物 o3 の距離 は,隣接情報の距離が 2 ,部分の形状の距離の累計が 9/4 となり,両者の合 計をとって17/4 となる.
2.3.2 内包の形状記述部以外と全体での計算
図4:事物関の形状の比較内包のうち形状に関係しない記述子にかんしては,ふたつの事物に共通に存在 するか,共通に存在しないものは無視し,どちらか一方にのみ存在する記述子 の数を合計する(式8).
形状に関係する距離と関係しない距離を単純に足し合わせたものを,事物間の 距離と定義する.すなわち,
ただし, shpd(i, j): 事物間の形状類似度距離
noshpd(i, j): 事物間の非形状類似度距離
adjd(i, j): 事物間の形状類似度距離の全体形状部
subd(i, j): 事物間の形状類似度距離の部分形状部
xor(A, B): AとBの排他的論理和,ただし 1:真,0:偽
adj(im, jn) = 1:事物iのm番目とn番目の部分が隣接している, 0:そうではない
not(A): Aの論理的否定,ただし 1:真,0:偽
equals(ip, jq): 事物 j の非形状記述子 q が事物 i の非形状記述子 p に等しい
ip, is, jq, jr : 非形状記述子
であり,levim, jm は 事物 i,j それぞれの m 番目の部分の形 状の最も特殊な共通クラスのレベルである. 3 概念階層の構築上述の概念間の正負事例の関係性を利用するためには,概念階層が構成されて いなければならない.このため,以下の方法でラベル概念間の階層関係を決定 する.
まず,上記の手法を用いた汎化を行う概念を決定するため,セッション冒頭で 与えられた刺激事物を前セッションまでの知識状態において被覆する概念のラ ベルを探す.それらに刺激ラベルが含まれていなければ,まずそのラベルを前 章で述べた階層関係を利用する方法で帰納する.失敗した場合においては,類 似度計算を用いる.
次に,刺激事物を被覆するラベルに刺激ラベル以外のラベルが含まれていれば, その各々に対し,刺激ラベルと同様,階層関係を用いた方法と類似度計算を用 いた方法で帰納を行う.
上記の個別概念の学習の終了後,ラベル概念間の階層関係を作り直す. セッション冒頭において刺激事物を被覆していたラベルの各々について,それ が被覆する事物を調べ,刺激ラベルが被覆するものと比較する.一方が他方の 被覆事物を全て被覆しているとき,被覆の大きい側のラベルを上位とする階層 関係を仮定し,下記の原則に則って階層関係を修正する.
(1)導出された階層関係が現状で満たされていれば,何もしない. (2)「基礎レベル」は複層性を許さないので,両者がともにこのレベルの場合は, 片方を「上位レベル」または「下位レベル」に移す. (3)両者が「上位レベル」または「下位レベル」の一方にあるか,上位とされたも のが「下位レベル」に,もう一方が「上位レベル」にあるとき,矛盾が生じる 場合がある.この場合,片方の既存の階層関係を全て解消する. (4)「上位レベル」にとどまるには,一定の ``広さ'' ないしは ``一般性'' を維 持しなければならない. (5)これらの確認の後,両ラベル間に階層関係を宣言する.
4 まとめと補遺本論文では,モデルの概念世界の発達,とりわけ階層的概念発達をより明示的 に行うためのモデルの修正を提案した.「形状類似性バイアス」の働きを詳細 に定めた点,および階層関係の発達と類似度による判定基準とを絡めたモデル としている点が重要である.しかし,今回の修正モデルでは,主に類似度の面 でいくつかの閾値を必要としている.これらをどのように定めるのか,静的な ものとなるのか動的なものがよいのかも,これから考える必要がある.
参考文献
- Carey, S., "Conceptual Change in Childhood", MIT Press, 1985.
- Furukawa, K., Kobayashi, I., Ozaki, T. and Imai, M.: A Model of Children's Vocabulary Acquisition using Inductive Logic Programming, proc. of the 2nd International Conference on Discovery Science, pp. 321-322, LNAI1721, S. Arikawa and K. Furukawa (Eds.), Springer, 1999.
- 今井むつみ: 『認知科学モノグラフ 5: ことばの学習のパラドックス』. 共立出版, 1997.
- 小林郁夫, 古川康一, 今井むつみ, 尾崎知伸: 帰納論理プログラミングによる幼児の名詞語彙獲得のモデル化, 電子情報通信学会技術研究報告(言語理解とコミュニケーション研究会) v.99 No.387, pp. 29-36, 1999.
- Markman, E. M.: "Categorization and Naming in Children", (MIT Press series in learning, development, and conceptual change), MIT Press, 1989.