Education
2022.8.2 Release
7月6日に、人間知.脳.AI研究教育センター(CHAIN)の教育プログラム必修科目である「人間知序論Ⅰ」の第4回目の講義が行われました。講義を担当するのはCHAINのコアメンバーであり文学研究院で社会心理学や進化行動科学を専門とされている竹澤正哲先生で、講義テーマは「小さなモデルと大きな現実の世界:文系のためのモデリング入門」でした。以下では講義の内容、授業の様子、講義に対する感想を述べます。
今回の講義の主題は「人間や科学が世界をどう認識しているか」というものでした。一般的に我々は、世界の一部を切り取った統計モデルを用いて現実世界を認識しようとしています。つまり現実という不可知の対象を、人間が理解できる言葉や概念を用いた統計モデルで記述することで認識しようとします。では、統計を用いたモデリングによって世界を正確に認識することは可能なのでしょうか?世界を再現する統計モデルについて議論する際には、将来予想を行うことを目的とする「予測」と現実世界での現象を再現することを目的とする「説明(因果推定)」の2つを独立して考える必要があります。このうちまず「予測」について、WAIC(Widely-Applicable Information Criterion)という情報量基準を用いると、新しいデータに対する予測誤差を最小化することができ、将来を正確に予測するモデルを探すことができます。一方「説明(因果推定)」については、研究者が持つ事前知識が重要な役割を果たしているため、予測力の高いモデルによって正確に因果推定できるとは限りません。複数のモデルの中から真のモデルを見つける際には、WBIC(Widely Application Bayesian Information Criterion)という情報量基準が用いられます。WBIC はベイズ自由エネルギーの近似値のことを言います。ベイズ自由エネルギーとは、推定されたモデルがデータをどれだけ良く記述できるかの指標を意味します。そのためWBICを最小化するモデルを選択することにより、真のモデルが「当たる」確率を最大化することができます。しかし、実際に得られるデータはおそらく私たちが認識できないような複雑なプロセスで生成されているため、真のモデルを見つけることはできないと考えられます。そのため、WBICは小さな世界(モデル)の中で起こる現象を調べることには適していますが、大きな世界(現実)を分析するには有用ではありません。一方、WAICは真のモデルを見つけるには不向きですが、WAIC を用いた予測によって大きな世界の理解に近づくことができます。したがって、統計モデルを用いて大きな世界を再現し理解することは現段階では不可能ですが、WAIC を用いることで真実に近づくことは可能であり、実際に現在多くの研究者がWAIC を用いたデータ解析を行っています。
授業はハイブリッド形式(対面+オンライン)で行われました。おそらく多くの学生にとってなじみが薄いモデリングに関する授業でしたが、議論の場ではモデルに関する質問が多々出ていました。また、真のモデルは存在するのかといった質問や人工知能や予測を使った研究は科学であるかといった質問も出ており、活発な議論がされていました。
私は現実(大きな世界)をモデリングによって人間の手で再現することができるかという点に興味を持って、今回の講義を受けていました。講義を聴いて、私たちはまだこの世界のほんの一部しか理解しておらず、モデリングの前提が人間の認識に依存してしまうことを痛感しました。また、そのような人間の認識による前提を置かれた統計モデルは限界が生まれ、モデリングによる大きな世界の理解はほとんど不可能であると感じました。しかし、現在大きな世界の一部を理解するために多くのデータをもとにした統計的なモデリングが行われています。そして、私たちが世界を認識するためにはこのような地道な作業を積み重ねることで少しずつ真実に近づくことが一番の近道であると私は考えています。ただし、私たちがモデリングによって大きな世界を理解しようとするとき、人間の認識や統計モデルの限界をよく理解することが要求されると感じました。