← 記 / Journal に戻る

オセロの棋譜だけ覚えたAIの“頭の中”に、盤面の地図があった

盤面も、ルールも、石の存在すら教えず、ただ「次の一手」を当てさせるだけ——。そんな訓練をしたAIの内部を覗くと、誰も教えていない“盤面の地図”が自然にできていました。「AIは意味を理解しているのか」に迫るICLR 2023の名研究を、やさしく解説します。

オセロの棋譜だけ覚えたAIの“頭の中”に、盤面の地図があった

「AI は言葉の意味を分かっているのか、それともそれっぽい単語を並べているだけなのか」——生成 AI が広まってから、ずっと議論されてきた問いです。

この問いに、オセロ(リバーシ)を使って驚くほど鮮やかに切り込んだ研究があります。2023 年の国際会議 ICLR で発表された 「Emergent World Representations(創発する世界の表現)」、通称 Othello-GPT です。

何をした研究なのか

研究チームは、AI に 大量のオセロの棋譜 を見せ、たった一つのことだけを訓練しました。

「これまでの手の並びから、次に置かれる一手を当てよ」

ここが重要です。AI には、

  • 盤面が 8×8 であることも
  • 石を挟むと裏返るというルールも
  • そもそも「盤面」という概念があることも

一切教えていません。ただ手の記号の並びを見て、次の記号を予測する。文章で次の単語を予測する言語モデルと、まったく同じ仕組みです。

何が見つかったのか

訓練後、研究者は AI の 内部の状態(脳でいえば神経活動)を覗いてみました。すると——

AI の内部に、今この瞬間の盤面がどうなっているかを表す情報が、はっきりと刻まれていたのです。どのマスが黒で、どのマスが白で、どこが空いているか。誰も教えていないのに、AI は盤面の“地図”を自分の中に作り上げていました。

さらに決定的なのは、ここからです。研究者がその内部の“地図”を 書き換えて(「このマスの石をひっくり返したことにする」と細工して)みると、AI の次の一手の予測も、その細工どおりに変化しました。つまり、内部の地図は単なる飾りではなく、AI が 実際に使って考えている本物の世界モデル だったのです。

なぜ面白いのか

「次の記号を当てる」だけの単純な訓練から、AI は 記号の裏にある“仕組み”そのもの を再構築していました。これは「AI はただの確率的なオウム返しだ」という見方に、強い反例を突きつけます。

  • 表面:記号の並びを予測しているだけに見える
  • 内部:その記号を生み出している 世界の構造(盤面) を、自前でモデル化している

言葉に置き換えれば、「文章を学んだだけの AI が、その文章が描く 世界の様子 を内部で組み立てているかもしれない」という希望(と問い)につながります。後続研究では、この盤面の地図が驚くほど きれいな“線形”の形 で表れていることも示され、議論はさらに深まりました。

ひとつ注意

オセロは、ルールも状態も明快な、いわば理想的な実験場です。「だから言語モデルも世界を完全に理解している」と一足飛びに結論づけることはできません。それでも、「統計的な予測の訓練から、世界の構造が創発しうる」ことを、誰の目にも分かる形で示した意義は大きいものでした。

持ち帰り

AI の“頭の中”は、ブラックボックスのまま放置されがちです。でも、ちゃんと覗けば、そこには 意味のある地図 が描かれていることがある。AI の中身を可視化し、納得して使う——この 解釈可能性(interpretability) の発想は、私たちが現場で AI を使うときの信頼の土台でもあります。

AI の挙動の検証・可視化を含む開発のご相談は、お問い合わせからどうぞ。


出典