2026年5月31日研究ダイジェスト

不確実なリアルタイム戦略ゲームを制したAI｜AlphaStar

相手の動きが見えず、一瞬の判断が勝敗を分ける『StarCraft II』。囲碁よりも“現実に近い”この難敵を、2019 年の AlphaStar はグランドマスター級（上位 0.2%）で攻略しました。やさしく解説します。

囲碁で世界王者を破った AI の次の挑戦は、意外にもテレビゲームでした。題材は、リアルタイム戦略ゲームの名作 『StarCraft II』。囲碁よりずっと“現実に近い”難しさを持つことで知られます。

2019 年、Google DeepMind の AlphaStar は、このゲームで人間のトップ層と渡り合い、**グランドマスター（最上位ランク）**に到達しました。

なぜ囲碁より難しいのか

囲碁とちがって、StarCraft II には「現実の意思決定」に似た厄介さが詰まっています。

相手の動きが見えない：マップの大半は霧に隠れ、敵が何をしているか分からない（不完全情報）
待ってくれない：交互に手番が回る囲碁と違い、時間が止まらず刻一刻と進む
選択肢が膨大：どのユニットを、いつ、どこへ動かすか——一瞬ごとに無数の組み合わせがある
長い時間軸：序盤の判断が、何分も先の勝敗に効いてくる

「相手の手が見えず、時間に追われ、選択肢が爆発的に多い」。これはまさに、ビジネスや現実の駆け引きにも通じる難しさです。

何をした研究なのか

AlphaStar の鍵は、**「AI どうしのリーグ戦」**でした。

1 体の AI をひたすら強くするのではなく、いろいろな戦い方をする AI を多数育て、互いに対戦させ続けたのです。

攻撃的なタイプ、守備的なタイプ、奇襲を狙うタイプ……多様な“選手”を用意
それぞれが互いの弱点を突き合い、**「ある戦法 → それを破る戦法 → さらにそれを破る戦法」**と進化していく
こうして、特定の戦法に偏らない、総合力の高い AIが鍛えられた

人間のプロの試合データから基礎を学び、そこからこのリーグ戦（強化学習）で磨き上げました。

いちばんすごいのはここ

結果、AlphaStar は StarCraft II の 3 つの種族すべてでグランドマスターに到達し、公式ランキング登録者の上位 0.2% 圏内という実力を示しました。

特筆すべきは、一つの必勝パターンに頼らなかったことです。相手や状況に応じて柔軟に戦い方を変える——「弱点を突かれにくい、バランスの取れた強さ」を、AI どうしを競わせることで獲得しました。ライバルをぶつけ合って全体を底上げするこの発想は、GAN（贋作師と鑑定士）の話とも通じます。

ひとつ注意

AlphaStar は強力でしたが、人間とまったく同じ条件だったわけではありません（画面の見え方や操作のしくみなど、公平性をめぐる議論もありました）。また、StarCraft II という閉じた世界での成果が、そのまま現実の複雑な問題に直結するわけでもありません。とはいえ、**「見えない・待ってくれない・選択肢が多い」**という現実的な難所に AI が踏み込んだ意義は、とても大きいといえます。

持ち帰り

きれいなルールの盤上ゲームから、不確実で時間に追われる“現実寄り”の課題へ——。AlphaStar は、AI の意思決定が一歩前に進んだことを示す研究です。多様なライバルを競わせて総合力を鍛える発想は、現実の戦略づくりにもヒントを与えてくれます。

AI 活用や意思決定・最適化のご相談は、お問い合わせからどうぞ。

出典

Grandmaster level in StarCraft II using multi-agent reinforcement learning（Vinyals et al., Nature, 2019）