2000年度人工知能学会全国大会(第14回)論文集, pp.281-284, 2000

帰納論理プログラミングによる階層的名詞概念の学習

Learning of the hierarchy of nominal concepts using Inductive Logic Programming

小林郁夫† 尾崎知伸† 古川康一† 今井むつみ‡

Ikuo Kobayashi Tomonobu Ozaki Koichi Furukawa Mutsumi Imai

慶応義塾大学大学院政策・メディア研究科†
Graduate School of Media and Governance, Keio University

慶応義塾大学環境情報学部‡
Faculty of Environmental Information, Keio University

abstract: We have developed artificial models of a vocabulary learner supported by a theory of constraint in naming suggested in cognitive psychology. The method of Inductive Logic Programming provides a good formalization for this problem. In this article, we suggest a new model to deal with a hierarchy of concepts because of importance of ontological development in concepts' learning. To let the model develop a concept hierarchy, we introduce criteria by which each of objects is decided to be dealt with as a positive, negative or `neutral' example in concept induction for the correspondent label. The criteria are from two evidences; one is the constraint by the hierarchical relations between concepts, and the other is the similarity in shape.

1 研究の概要
我々は，「語彙の制約」[ 5, 3] などの認知心理学の成果に基づき，論理プログラミングによる幼児の名詞語彙獲得に関する研究を行っている[ 2, 4 ] ．その際，入力である`` ラベル''と``事物''，およびその``属性情報''を，帰納論理プログラミングにおける``クラス''，``事例''および``背景知識''にそれぞれ対応づけることで，言語獲得の問題を帰納推論の問題として定式化している (図１})．このモデルでは，ある一つの事物とラベルの組が与えられる度に，(1)そのラベルすなわちクラスに関する概念を獲得する，(2)得られた概念，もしくは与えられるラベルと事物のペアが，既得の概念と矛盾する場合には，帰納のやり直しや，階層的関係，排他的関係の導入により，矛盾を解決する，という処理が行われる．すなわち，ラベルと事物の組を与えてから，概念の獲得や修正などを行い，次のラベルと事物の組が与えられる準備が整うまでが一単位として扱われ，本論文ではこれをセッションと呼ぶ．各セッションの冒頭で与えられる事物とラベルを，そのセッション中はそれぞれ刺激事物，刺激ラベルと呼ぶ．また，ある概念の上位概念とは，その概念の直接の上位概念だけでなく，その直上の概念の各上位概念も含む．これは，下位概念に関しても同様である．さらに，一般には，事物に関する属性情報としてあらゆるものを考えなければならないが，現在のモデルでは，認知心理学の研究成果に基づき，形状，材質，色などの主に視覚的情報だけを扱うことにしている．

本論文では，これまでに構築したモデルに対し，類似度による概念間の関係の判断が，それ以降の学習に影響を及ぼすような機構を追加する．

以下に本論文の構成を示す．次章では，個々のラベルの帰納的学習において，どの事物を学習目標に対する正負事例として選びだすかについて論じる．うち第1節では概念階層，第2節では目標ラベルと事例候補の事物との類似度を利用することを提案し，第3節でラベル-事物間の類似度の計算に必要な事物-事物間の類似度の計算を定義する．さらに章を改めて，各セッションでの学習の全容を示し，その中で概念階層の構築について略述する．終章で遺漏を補う．

図１：個々の語の意味の獲得の帰納モデル
2 個々のラベルの帰納的学習における事例の設定
言語獲得においては，各ラベルに関する負事例が明示的に与えられることは期待できない．したがって，何らかの方法でラベルに対する負例を設定する必要がある．ここでは，階層関係の利用と類似度の利用による事例の設定方式について説明する．
2.1 階層関係にあるラベルの正負事例の利用
あるラベル l1 を帰納的に学習するとき，図２に示すように，事物 o1，o4 が l1 にとっての正事例であるべきだという刺激があったか，後述の類似度計算によってそのように判断されたとする．また，同じく類似度計算によって事物 o7 が負事例であるべきだと判断されたとする．またそれまでのセッションの積み上げの間に，別のラベル l2 が l1 の上位概念と仮定され，l2 の正事例として事物 o1，o2，o3，o4，o5 が，負事例として事物 o6 が負事例であるべきである場合，上位の概念が被覆しないものを被覆することはないと考え，o6 を負事例とする．

同様に，それまでの過程で l1 の下位概念と仮定されたラベル l3 のその時点における仮定の正事例が o1，o2 であり，負事例が o7，o8 であるとき，下位の概念によって被覆されるものを被覆しないことはないと考え，o2 を正事例とする．

図２：概念階層を利用した正負の事例の付与
2.2 事物と既知ラベルとの距離の利用
階層概念の利用による正負事例の設定は，概念階層が理想的な状態である場合には有効であるが，言語獲得の途上において，この仮定が成り立つとは限らない．したがって別の方法で事例を設定する必要がある．
2.2.1 距離の計測法とそれを用いた正負の判断
以下の条件を満たす事物を対象に，ラベル概念の学習における正負事例の設定を行う．

当該ラベルに被覆されているがそのラベルとの関連づけを既往セッションの刺激中で提示されていない事物

当該ラベルとの関連づけを既往セッションの刺激中で提示されているが，そのラベルに被覆されていない事物

上記の条件を満たす事物について，各々，目標のラベルとの類似度を計測する．類似度は距離の形式で計算する．よって，より似ているものが数値が小さく，同一のもの同士の類似度を計測すると0となる(式２)．この数値をラベルの ``一般性'' によって正規化した値(式１)がある値以上のものは負事例，別のある値以下のものは正事例とする．また両数値の中間にあたる類似度距離にあるものは中立として，帰納では無視する．

ただし，ラベル概念は変化の過程にあり，また本来，事物とは別の次元に属する比較不可能なものであるので，

当該ラベルに被覆され，かつそのラベルとの関連づけを既往セッションの刺激中で提示されている事物

を利用し，ラベルと事物の距離を計算する．すなわち，

ただし， obji, objj, objk∈S(l)
S(l) = ded(l) ∩ link(l)
ded(l) = ｛objn | l の概念が objn を被覆｝
link(l) = ｛objn | l と objn は既往セッションの刺激中で関連づけられている｝
ACB : 大きさ Aの集合からB個の要素をとる組み合わせの数
card(A): 集合Aの要素の数

となる．式１で示すように，ラベルと境界的な事物との類似度は相対的である．より多様な事物と関連づけられ，より多様な事物を被覆し，その両者がより高い割合で重なりあっているラベルほど，より多様な境界的な事物を正事例とする．
2.3 事物間の類似度距離
上述のように，ラベルと正負の振り分けを決定したい事物との類似度の計算には，事物間の類似度距離が利用される．ここでは，「形状類似性バイアス」 [3] を考慮し，重視する形状に関係するクラスの記述子に関わる計算を第1項で，それ以外のクラスの記述子に関わる部分の計算，および両者から導かれる事物間の類似度を第2項で記述する．
2.3.1 内包の形状記述部
事物の形状は，ある対象が事物の ``部分である'' ことを示す述語，それらの ``部分の形状'' を表現する述語，および各部分同士が ``隣接しているか否か'' を示す述語から成り立っている(図４左側参照)． ``隣接'' の情報から図中央のようなグラフ表現を導く．事物の部分はグラフの節点として表現される．

このグラフに，多くの隣接節点を持つ節点から順に番号を振る．隣接する節点の数の等しい節点が複数ある場合には，隣接する節点のさらに隣の節点(距離2 の節点)の数の合計を調べ，多い方を選択する．例えば図４右側の o3 において，so7，so8，so9 はいずれも隣接節点の数が 1 であるが，距離 2 の節点のの数の合計は，so7 と so8 が 2 であるのに対し， so9 では 1 である．距離を伸ばして比較しても同じである場合には，部分の形状自体の類似性を図３に示すような階層から調べ，より類似した節点を選択する．たとえば o2 の節点である so1 と so3 は o3 の 2 番である so5 と比較され，形状の上でより類似している so1 が 2 番に選ばれる． so7 と so8 についても同様に so3 との類似度で優先順位が決まる．

図３：形状のオントロジー
ひとつのグラフからふたつの節点をとってくると，隣接している場合とそうでない場合がある．このことを利用して，事物間の類似度をはかる(式６)．両事物で i 番目と j 番目の部分が共に隣接しているか，両事物ともで隣接していない場合，0 を，片方の事物で隣接していてもう一方で隣接していない場合 1 を累算する．各事物の部分の数は互いに異なるので，i 番目と j 番目の両者が片方の事物で揃っていない場合がある．この場合，その事物では i 番目と j 番目が隣接していないものとみなす．

さらに，同じ番号をもつ部分同士の類似度距離を累算(式７)して内包の形状関係クラスの類似度距離(式５)を完成させる．事物の部分同士の形状上の類似度距離は，最も特殊な共通の形状クラスの階層のレベルで判断する． ``cylinder'' と ``frustrum'' の間の距離は，双方の共通クラスである ``conoid'' の階層レベルが 2 であるので，2 の 2 乗分の 1 ，すなわち 1/4 となる．双方が同じ表現である場合，距離を 0 とする．また，一方の事物の部分に対応する部分がもう一方の事物にない場合，距離を 1 とする．

このようにして，図４の事物 o2 と事物 o3 の距離は，隣接情報の距離が 2 ，部分の形状の距離の累計が 9/4 となり，両者の合計をとって17/4 となる．

図４：事物関の形状の比較
2.3.2 内包の形状記述部以外と全体での計算
内包のうち形状に関係しない記述子にかんしては，ふたつの事物に共通に存在するか，共通に存在しないものは無視し，どちらか一方にのみ存在する記述子の数を合計する(式８)．

形状に関係する距離と関係しない距離を単純に足し合わせたものを，事物間の距離と定義する．すなわち，

ただし，
shpd(i, j): 事物間の形状類似度距離
noshpd(i, j): 事物間の非形状類似度距離
adjd(i, j): 事物間の形状類似度距離の全体形状部
subd(i, j): 事物間の形状類似度距離の部分形状部
xor(A, B): AとBの排他的論理和，ただし 1:真，0:偽
adj(im, jn) = 1:事物iのm番目とn番目の部分が隣接している， 0:そうではない
not(A): Aの論理的否定，ただし 1:真，0:偽
equals(ip, jq): 事物 j の非形状記述子 q が事物 i の非形状記述子 p に等しい
ip, is, jq, jr : 非形状記述子

であり，levim, jm は事物 i，j それぞれの m 番目の部分の形状の最も特殊な共通クラスのレベルである．

3 概念階層の構築
上述の概念間の正負事例の関係性を利用するためには，概念階層が構成されていなければならない．このため，以下の方法でラベル概念間の階層関係を決定する．

まず，上記の手法を用いた汎化を行う概念を決定するため，セッション冒頭で与えられた刺激事物を前セッションまでの知識状態において被覆する概念のラベルを探す．それらに刺激ラベルが含まれていなければ，まずそのラベルを前章で述べた階層関係を利用する方法で帰納する．失敗した場合においては，類似度計算を用いる．

次に，刺激事物を被覆するラベルに刺激ラベル以外のラベルが含まれていれば，その各々に対し，刺激ラベルと同様，階層関係を用いた方法と類似度計算を用いた方法で帰納を行う．

上記の個別概念の学習の終了後，ラベル概念間の階層関係を作り直す．セッション冒頭において刺激事物を被覆していたラベルの各々について，それが被覆する事物を調べ，刺激ラベルが被覆するものと比較する．一方が他方の被覆事物を全て被覆しているとき，被覆の大きい側のラベルを上位とする階層関係を仮定し，下記の原則に則って階層関係を修正する．

(1)導出された階層関係が現状で満たされていれば，何もしない． (2)「基礎レベル」は複層性を許さないので，両者がともにこのレベルの場合は，片方を「上位レベル」または「下位レベル」に移す． (3)両者が「上位レベル」または「下位レベル」の一方にあるか，上位とされたものが「下位レベル」に，もう一方が「上位レベル」にあるとき，矛盾が生じる場合がある．この場合，片方の既存の階層関係を全て解消する． (4)「上位レベル」にとどまるには，一定の ``広さ'' ないしは ``一般性'' を維持しなければならない． (5)これらの確認の後，両ラベル間に階層関係を宣言する．

4 まとめと補遺
本論文では，モデルの概念世界の発達，とりわけ階層的概念発達をより明示的に行うためのモデルの修正を提案した．「形状類似性バイアス」の働きを詳細に定めた点，および階層関係の発達と類似度による判定基準とを絡めたモデルとしている点が重要である．しかし，今回の修正モデルでは，主に類似度の面でいくつかの閾値を必要としている．これらをどのように定めるのか，静的なものとなるのか動的なものがよいのかも，これから考える必要がある．

参考文献

Carey, S., "Conceptual Change in Childhood", MIT Press, 1985.

Furukawa, K., Kobayashi, I., Ozaki, T. and Imai, M.: A Model of Children's Vocabulary Acquisition using Inductive Logic Programming, proc. of the 2nd International Conference on Discovery Science, pp. 321-322, LNAI1721, S. Arikawa and K. Furukawa (Eds.), Springer, 1999.

今井むつみ: 『認知科学モノグラフ 5: ことばの学習のパラドックス』. 共立出版, 1997.

小林郁夫, 古川康一, 今井むつみ, 尾崎知伸: 帰納論理プログラミングによる幼児の名詞語彙獲得のモデル化, 電子情報通信学会技術研究報告（言語理解とコミュニケーション研究会） v.99 No.387, pp. 29-36, 1999.

Markman, E. M.: "Categorization and Naming in Children", (MIT Press series in learning, development, and conceptual change), MIT Press, 1989.

小林郁夫†	尾崎知伸†	古川康一†	今井むつみ‡
Ikuo Kobayashi	Tomonobu Ozaki	Koichi Furukawa	Mutsumi Imai