スクリプトのモデル (1)

Elman, J. L., & McRae, K. (2019). A model of event knowledge. Psychological review, 126(2), 252-291.

個人的にはすごく重要な論文が出たので, 少し丁寧に書き残しておきたい。Event knowledgeとは, レストランに行く時に何が起こるかなど出来事知識のことを指し, スクリプトと置き換えられることも多い。簡単にこの論文の背景を説明しておくと, この論文の著者はJeffery Elman先生である。Elman先生といえば, Elman networkやRethinking innatenessで知られ, 主に言語発達について計算論的視点から研究を大きく進めた偉大な研究者である。なので, 本論文のテーマは今までやられてきたテーマから遠くはないものの, 決して近くはないという印象である。実はElman先生は, この論文がアクセプトされる少し前に亡くなられている。CogSciでの発表などを見る限り, ここ3, 4年はこの論文に関する仕事に精力的に取り組まれており, Elman先生が最後に大成させた大仕事でもある。

Event knowledgeは, 今まで記憶の想起, 虚偽記憶, 再生, 再認, 推論, 行為の認識など多くのことに関与することが多くの研究で示されている (Amso, Frank, & Shuwairi, 2008; Bartlett, 1932; Cann, McRae, & Katz; Graesser, Singer, & Trabasso, 1994; Shiply & Zacks, 2008)。しかし, これらの研究には4つの課題が存在する。

① 行動実験の結果が一貫していない(出来事の時系列表象に関する知見や推論に関する知見)

② Event knowledgeと呼ばれるものは2種類に分類される。1つは長期記憶内に保管される知識であり, もう1つはある状況で経験された出来事の心的表象(より一時性を重視している)である。 

③ Event knowledgeの重要な特徴である, 一般性と各状況を特徴づける多様性を十分にモデル化できていない。

④ 最後にEvent knowledgeがどのように学習されるのかがわかっていない。

これらの課題を解決するために, 3つのを問いを立てている。具体的には, ① Event knowledgeがどのようにして次に起こることなどの推論をサポートするのか (研究1), ② 新奇な状況でEvent knowledgeはどのように展開されるのか (研究2), ③ Event knowledgeの時系列構造がいかに表象されるのか (研究3) が挙げられる。こうした問いの検証の手立てとして, 本論文では計算機モデルを使用している。このEvent knowledgeのモデルは言語モデルとも共通している部分は多くあるが, 異なる部分も多い。モデルについて, そのデザインから説明していく。

本論文では, PDPモデルを使用する。PDPモデルを利用するのには2つの理由がある。1つ目は, constraint satisfaction (制約充足) である。制約充足のネットワークでは, 共起パターンがモデル内のユニット間の重み付けを発生させる。先行経験と一部合致するようなパターンに次に出会った時には, そのネットワークは以前のパターンを再現しようとするとともに, 一致していない要素が抑制されるようになる。このパターンこそがスキーマにあたる。2つ目は, モデルが行為系列を学習することができる点である。このモデルでは, 事前の情報から具体的な情報を削ぎ落とした表象を形成してゆく。特徴的なのは, モデルが予測を行なっている点であり, そうした予測と実際の入力との差分をもとに学習を進めてゆく。

モデルの実際の構造に話を移すと, このモデルではあらかじめEvent knowledgeは想定していない。時系列的構造を持ち, ある活動パターンが見られると, それをEvent knowedgeと呼ぶという創発性に重きを置いたモデルである。モデルはまず, 現在の活動を表現するネットワーク(Current activity)と次の行為を予測するネットワーク(Next activity)の2つがある。それぞれのネットワークには活動パターンを構成する要素として, Agents, Actions, Patients, Instruments, Locations, Recipientが含まれる。たとえば, Current activity networkではステーキを切る場合は, ナイフがほんとどであり, ファーストフード店よりもレストランでより起こりそうで, 時間的には夕方が多いなどの活動のパターンである。Next activity networkでは次の行為が何になるのかを予測するように学習が行われ, 次第に行為系列全体を取りまとめる高次の系列表象が獲得される。中間層はCurrent activity netwrok と相互に関連しあい, pattern completionを担っている。また, 中間層とNext activity netwrok は予測を担っている。

このモデルより得られた結果については次の記事で紹介する。



Yanaoka's research page

大阪教育大学で教員をしている柳岡開地 (Kaichi YANAOKA) のウェブページです。 子どもの認知発達に関心があり,実験や観察を通じて研究を行っています。 ※このウェブページは個人的な場所であり,所属とは関係ありません。 ※リンクいただける方はご一報ください。

0コメント

  • 1000 / 1000