オセロの棋譜だけ覚えたAIの“頭の中”に、盤面の地図があった
盤面も、ルールも、石の存在すら教えず、ただ「次の一手」を当てさせるだけ——。そんな訓練をしたAIの内部を覗くと、誰も教えていない“盤面の地図”が自然にできていました。「AIは意味を理解しているのか」に迫るICLR 2023の名研究を、やさしく解説します。
「AI は言葉の意味を分かっているのか、それともそれっぽい単語を並べているだけなのか」——生成 AI が広まってから、ずっと議論されてきた問いです。
この問いに、オセロ(リバーシ)を使って驚くほど鮮やかに切り込んだ研究があります。2023 年の国際会議 ICLR で発表された 「Emergent World Representations(創発する世界の表現)」、通称 Othello-GPT です。
何をした研究なのか
研究チームは、AI に 大量のオセロの棋譜 を見せ、たった一つのことだけを訓練しました。
「これまでの手の並びから、次に置かれる一手を当てよ」
ここが重要です。AI には、
- 盤面が 8×8 であることも
- 石を挟むと裏返るというルールも
- そもそも「盤面」という概念があることも
一切教えていません。ただ手の記号の並びを見て、次の記号を予測する。文章で次の単語を予測する言語モデルと、まったく同じ仕組みです。
何が見つかったのか
訓練後、研究者は AI の 内部の状態(脳でいえば神経活動)を覗いてみました。すると——
AI の内部に、今この瞬間の盤面がどうなっているかを表す情報が、はっきりと刻まれていたのです。どのマスが黒で、どのマスが白で、どこが空いているか。誰も教えていないのに、AI は盤面の“地図”を自分の中に作り上げていました。
さらに決定的なのは、ここからです。研究者がその内部の“地図”を 書き換えて(「このマスの石をひっくり返したことにする」と細工して)みると、AI の次の一手の予測も、その細工どおりに変化しました。つまり、内部の地図は単なる飾りではなく、AI が 実際に使って考えている本物の世界モデル だったのです。
なぜ面白いのか
「次の記号を当てる」だけの単純な訓練から、AI は 記号の裏にある“仕組み”そのもの を再構築していました。これは「AI はただの確率的なオウム返しだ」という見方に、強い反例を突きつけます。
- 表面:記号の並びを予測しているだけに見える
- 内部:その記号を生み出している 世界の構造(盤面) を、自前でモデル化している
言葉に置き換えれば、「文章を学んだだけの AI が、その文章が描く 世界の様子 を内部で組み立てているかもしれない」という希望(と問い)につながります。後続研究では、この盤面の地図が驚くほど きれいな“線形”の形 で表れていることも示され、議論はさらに深まりました。
ひとつ注意
オセロは、ルールも状態も明快な、いわば理想的な実験場です。「だから言語モデルも世界を完全に理解している」と一足飛びに結論づけることはできません。それでも、「統計的な予測の訓練から、世界の構造が創発しうる」ことを、誰の目にも分かる形で示した意義は大きいものでした。
持ち帰り
AI の“頭の中”は、ブラックボックスのまま放置されがちです。でも、ちゃんと覗けば、そこには 意味のある地図 が描かれていることがある。AI の中身を可視化し、納得して使う——この 解釈可能性(interpretability) の発想は、私たちが現場で AI を使うときの信頼の土台でもあります。
AI の挙動の検証・可視化を含む開発のご相談は、お問い合わせからどうぞ。