Early in the learning process … … after 15 minutes of learning
Rewardfor decrease in WulongGoth’s health
Ralf Herbrich, ThoreGraepel, Joaquin QuiñoneroCandela Applied Games Group,MicrosoftResearch Cambridge
"Forza, Halo, Xbox Live The Magic of Research in Microsoft Products"
http://research.microsoft.com/en-us/projects/drivatar/ukstudentday.pptx
Early in the learning process … … after 15 minutes of learning
Punishmentfor decrease in either player’s health
Ralf Herbrich, ThoreGraepel, Joaquin QuiñoneroCandela Applied Games Group,MicrosoftResearch Cambridge
"Forza, Halo, Xbox Live The Magic of Research in Microsoft Products"
http://research.microsoft.com/en-us/projects/drivatar/ukstudentday.pptx
Black & White (2000, Lionhead)
•一体のクリーチャーを育てる /島民を導く
https://www.researchgate.net/publication/228617498_An_Agent_a_Bot_and_a_CGF_Walk_into_a_Bar/figures?lo=1
Richard Evans, “Varieties of Learning”, 11.2, AI Programming Wisdom
Black & White (Lionhead,2000)
Training of creature by learning
http://ww.youtube.com/watch?v=2t9ULyYGN-s
http://ww.lionhead.com/games/black-white/
Richard Evans, “Varieties of Learning”, 11.2, AI Programming Wisdom
Colin Gaudreau, Andreas Lasses, Game AI Summit: No Brakes! Machine Learning Vehicles in 'Star Wars Outlaws'Speaker(s):Colin Gaudreau, Andreas Lasses
https://gdcvault.com/play/1035556/Game-AI-Summit-No-Brakes
•トレーニングマップ
•ニューラルネットワークモデル
Colin Gaudreau, Andreas Lasses, Game AI Summit: No Brakes! Machine Learning Vehicles in 'Star Wars Outlaws'Speaker(s):Colin
Gaudreau, Andreas Lasses
https://gdcvault.com/play/1035556/Game-AI-Summit-No-Brakes
Colin Gaudreau, Andreas Lasses, Game AI Summit: No Brakes! Machine Learning Vehicles in 'Star Wars Outlaws'Speaker(s):Colin
Gaudreau, Andreas Lasses
https://gdcvault.com/play/1035556/Game-AI-Summit-No-Brakes
Colin Gaudreau, Andreas Lasses, Game AI Summit: No Brakes! Machine Learning Vehicles in 'Star Wars Outlaws'Speaker(s):Colin
Gaudreau, Andreas Lasses
https://gdcvault.com/play/1035556/Game-AI-Summit-No-Brakes
Colin Gaudreau, Andreas Lasses, Game AI Summit: No Brakes! Machine Learning Vehicles in 'Star Wars Outlaws'Speaker(s):Colin
Gaudreau, Andreas Lasses
https://gdcvault.com/play/1035556/Game-AI-Summit-No-Brakes
Rainbow Six Siege のAIボットの作り方
https://schedule.gdconf.com/session/machine-learning-summit-rainbow-six-siege-operation-bots/908153
Alex Busby, Joshua Romoff
Machine Learning Summit: 'Rainbow Six Siege': Operation BotsSpeaker
https://gdcvault.com/play/1035224/Machine-Learning-Summit-Rainbow-Six
Alex Busby, Joshua Romoff
Machine Learning Summit: 'Rainbow Six Siege': Operation BotsSpeaker
https://gdcvault.com/play/1035224/Machine-Learning-Summit-Rainbow-Six
•ユーザー位置統計情報 機械学習トレーニング
Alex Busby, Joshua Romoff
Machine Learning Summit: 'Rainbow Six Siege': Operation BotsSpeaker
https://gdcvault.com/play/1035224/Machine-Learning-Summit-Rainbow-Six
ファイル(ちゃんとフォーマット決めてます)に貯めます
Alex Busby, Joshua Romoff
Machine Learning Summit: 'Rainbow Six Siege': Operation BotsSpeaker
https://gdcvault.com/play/1035224/Machine-Learning-Summit-Rainbow-Six
•データパイプラインだって完備 いろんなデータを貯める
Alex Busby, Joshua Romoff
Machine Learning Summit: 'Rainbow Six Siege': Operation BotsSpeaker
https://gdcvault.com/play/1035224/Machine-Learning-Summit-Rainbow-Six
Alex Busby, Joshua Romoff
Machine Learning Summit: 'Rainbow Six Siege': Operation BotsSpeaker
https://gdcvault.com/play/1035224/Machine-Learning-Summit-Rainbow-Six
•位置情報のログを取ります
•ランタイム内で動作 ボット・アーキテクチャ
Alex Busby, Joshua Romoff
Machine Learning Summit: 'Rainbow Six Siege': Operation BotsSpeaker
https://gdcvault.com/play/1035224/Machine-Learning-Summit-Rainbow-Six
Alex Busby, Joshua Romoff
Machine Learning Summit: 'Rainbow Six Siege': Operation BotsSpeaker
https://gdcvault.com/play/1035224/Machine-Learning-Summit-Rainbow-Six
LorantMikolas
Machine Learning Summit: Enhancing Development with LLMs and Multimodal Retrieval in 'Call of Duty'
https://gdcvault.com/play/1035228/Machine-Learning-Summit-Enhancing-Development
•アセット探すのはたいへん これをLLMで解決しよう
LorantMikolas
Machine Learning Summit: Enhancing Development with LLMs and Multimodal Retrieval in 'Call of Duty'
https://gdcvault.com/play/1035228/Machine-Learning-Summit-Enhancing-Development
•最終的なツール画面
LorantMikolas
Machine Learning Summit: Enhancing Development with LLMs and Multimodal Retrieval in 'Call of Duty'
https://gdcvault.com/play/1035228/Machine-Learning-Summit-Enhancing-Development
•LLMで物語生成
https://schedule.gdconf.com/session/game-ai-summit-llm-as-core-gameplay-co-creative-storytelling-in-1001-nights/909299
YuqianSun
Game AI Summit: LLM as Core Gameplay: Co-Creative Storytelling in '1001 Nights
https://gdcvault.com/play/1035179/Game-AI-Summit-LLM-as
YuqianSun
Game AI Summit: LLM as Core Gameplay: Co-Creative Storytelling in '1001 Nights
https://gdcvault.com/play/1035179/Game-AI-Summit-LLM-as
YuqianSun
Game AI Summit: LLM as Core Gameplay: Co-Creative Storytelling in '1001 Nights
https://gdcvault.com/play/1035179/Game-AI-Summit-LLM-as
YuqianSun
Game AI Summit: LLM as Core Gameplay: Co-Creative Storytelling in '1001 Nights
https://gdcvault.com/play/1035179/Game-AI-Summit-LLM-as
YuqianSun
Game AI Summit: LLM as Core Gameplay: Co-Creative Storytelling in '1001 Nights
https://gdcvault.com/play/1035179/Game-AI-Summit-LLM-as
YuqianSun
Game AI Summit: LLM as Core Gameplay: Co-Creative Storytelling in '1001 Nights
https://gdcvault.com/play/1035179/Game-AI-Summit-LLM-as
Age of Empires III における地形自動生成
西川善司 , 「3Dゲームファンのための AGE OF EMPIRESエンジン講座 (後編)こだわりの影生成と算術合成
されるディテール、次回作は Xbox2?」, GAME Watch, 2005
FarCry 4 の事例
Julien Varnier, Far Cry's AI: A Manifesto for Systemic Gameplay
http://archives.nucl.ai/recording/far-crys-ai-a-manifesto-for-systemic-gameplay/
これからのゲームの作り方
オープンワールド
プロシージャル(自動生成)
適応型的 AI
(自動AI配置、自動ミッション生成)
PCGRL: Procedural Content Generation via Reinforcement Learning
Ahmed Khalifa, Philip Bontrager, Sam Earle, Julian Togelius
https://arxiv.org/abs/2001.09212
PCGRL: Procedural Content Generation via Reinforcement Learning
Ahmed Khalifa, Philip Bontrager, Sam Earle, Julian Togelius
https://arxiv.org/abs/2001.09212
PCGRL: Procedural Content Generation via Reinforcement Learning
Ahmed Khalifa, Philip Bontrager, Sam Earle, Julian Togelius
https://arxiv.org/abs/2001.09212
World
Sensor
知識
生成
Knowledg
e
Making
意思決定
Decision
Making
運動
生成
Motion
Making
Information Flow
記憶
Principle of Learning
ActionResult Decision
Making
Body
World
Sensor
知識
生成
Knowledg
e
Making
意思決定
Decision
Making
運動
生成
Motion
Making
Information Flow
記憶
Principle of Learning
ActionResult Decision
Making
Body
Deep Learning in Ubisoft
https://gdcvault.com/play/1025653/The-Alchemy-and-Science-of
The Alchemy and Science of Machine Learning for Games
Yves Jacquier(UbisoftMontreal)
Deep Learning in Ubisoft
https://gdcvault.com/play/1025653/The-Alchemy-and-Science-of
The Alchemy and Science of Machine Learning for Games
Yves Jacquier(UbisoftMontreal)
https://gdcvault.com/play/1025653/The-Alchemy-and-Science-of
35:00-
Deep Learning in Ubisoft
The Alchemy and Science of Machine Learning for Games
Yves Jacquier(UbisoftMontreal)
Deep Q Learning (深層強化学習 )
Q-Learning
×
Deep Learning
世界
五感
身体
言語
知識表
現型
知識
生成
Knowledge
Making
意思決定
Decision
Making
身体
運動
生成
Motion
Making
インフォメーション・フロー(情報回廊)
記憶
キャラクターにおける学習の原理
行動の表現結果の表現 意思決定
Q(s,a)
関数
世界
五感
身体
言語
知識表
現型
知識
生成
Knowledge
Making
意思決定
Decision
Making
身体
運動
生成
Motion
Making
インフォメーション・フロー(情報回廊)
記憶
キャラクターにおける学習の原理
行動の表現状態・結果の表現 意思決定
ニューラル
ネットワーク
(DQN)
Deep Q-Learning(2013)
Volodymyr Mnih, KorayKavukcuoglu, David Silver, Alex Graves,
IoannisAntonoglou, DaanWierstra, Martin Riedmiller(DeepMind Technologies)
Playing Atari with Deep Reinforcement Learning
http://ww.cs.toronto.edu/~vmnih/docs/dqn.pdf
画面を入力
操作はあらかじめ教える
スコアによる強化学習
DQN Breakout (Google Deep Mind)
https://www.youtube.com/watch?v=TmPfTpjtdgg
学習過程解析
Volodymyr Mnih, KorayKavukcuoglu, David Silver, Alex Graves,
IoannisAntonoglou, DaanWierstra, Martin Riedmiller(DeepMind Technologies)
Playing Atari with Deep Reinforcement Learning
http://ww.cs.toronto.edu/~vmnih/docs/dqn.pdf
囲碁AI:
位置評価関数から位置評価ニューラルネットワークへ
Mastering the game of Go with deep neural networks and tree search
http://www.nature.com/nature/journal/v529/n7587/full/nature16961.html
https://deepmind.com/research/alphago/
S
QR
Deep Mind社 「Agent 57」
•Atariの古典的なゲーム 57個を人間よりうまくプレイできるよう
になった Deep Mind社のAI
•https://deepmind.com/blog/article/Agent57-Outperforming-
the-human-Atari-benchmark
DQNのさらなる発展
•最後までスコアに苦しんだゲーム
•Montezuma’s Revenge
•Pitfall
•Solaris
•Skiing
Agent57: Outperforming the human Atari benchmark(DeepMind)
https://deepmind.com/blog/article/Agent57-Outperforming-the-human-Atari-benchmark
Dota2における人工知能
(OpenAI, 2019)
テーブルトーク RPGを用いた対話学習
年 企業 テーマ Open
2003 Microsoft 「TeoFeng」における強化学習
2005 Microsoft 「ForzamotorSports」における強化学習
2013 DeepMind Atariのゲームを DQNで学習
2015 DeepMind 囲碁AlphaGO
2017 AnyLogic 倉庫・機械などモデルのシミュレーション
Microsoft 「パックマン」多報酬学習
Hybrid Reward Architecture for Reinforcement Learning
2019 Google 「サッカーシミュレーター」による強化学習の研究 〇
DeepMind 「Capture the flag」によるディープラーニング学習
Microsoft 「AirSim」ドローンシミュレーター 〇
Nvidia 「ドライビングシミュレーター」
Mircrosoft 「TextWorld」アドベンチャーゲームを題材に言語学習 〇
facebook 「CraftAssist」マインクラフト内で会話研究 〇
CarMelon カーネギーメロン大学「 MineRL」マインクラフトを使った AIコンテスト 〇
facebook 「LIGHT」ファンタジーワールドを構築してクラウドワーカーで会話研究 〇
OpenAI 「Dota2」OpenAIによる「OpenAIFive」 〇
DeepMind 「StarCraft2」AlphaStar 〇
DeepMind 「Capture the Flag」QuakeIIIエンジン 〇
2020 Nvidia GameGAN「ディープラーニングによるパックマンの目コピー」 〇
DeepMind 「Agent57」Atariのほとんどのゲームを DQN+LSTMなどで学習 〇
OpenAI 「HIDE ANDSK」かくれんぼを用いたマルチエージェントのカリキュラム学習 〇
メタAI Left 4 Dead の事例
Michael Booth, "The AI Systems of Left 4 Dead," Artificial Intelligence and
Interactive Digital Entertainment Conference at Stanford.
http://ww.valvesoftware.com/publications.html
今回は Left 4 Dead の事例を見てみる。
メタAI(=AI Director)によるユーザーのリラックス度に応じた敵出現度
ユーザーの緊張度
実際の敵出現数
計算によって
求められた
理想的な敵出現数
Build Up …プレイヤーの緊張度が目標値を超えるまで
敵を出現させ続ける。
Sustain Peak … 緊張度のピークを 3-5秒維持するために、
敵の数を維持する。
Peak Fade … 敵の数を最小限へ減少していく。
Relax … プレイヤーたちが安全な領域へ行くまで、 30-45秒間、
敵の出現を最小限に維持する。
Michael Booth, "The AI Systems of Left 4 Dead," Artificial Intelligence and Interactive Digital Entertainment Conference at Stanford.
http://ww.valvesoftware.com/publications.html
より具体的なアルゴリズム
安全な領域までの道のり (Flow Distance)
メタAIはプレイヤー群の経路を
トレースし予測する。
-どこへ来るか
-どこが背面になるか
-どこに向かうか
Michael Booth, "The AI Systems of Left 4 Dead," Artificial Intelligence and Interactive Digital Entertainment Conference at Stanford.
http://ww.valvesoftware.com/publications.html
Procedural Generation in WarFrame
•Warframeではダンジョンが自動生成される。
Daniel Brewer, AI Postmortems: Assassin's Creed III, XCOM: Enemy Unknown, and Warframe(GDC2015)
http://www.gdcvault.com/play/1018223/AI-Postmortems-Assassin-s-Creed
ネットワーク上のグラフ検索法
A*法
M
F
L
B
A
S
O
P
D
C
G
S
V
H
Q
X
K
N
J
R
T
W
E
I
U
Z
Y
G
54
6
3
7
23
B C
3
3
2
2
4 3
5
5
出発点(S)を中心に、そのノードまでの
最も短い経路を形成して行く。 Gにたどり着いたら終了。
ゴール地点がわかっている場合、現在のノードとゴールとの推定距離(ヒューリスティック距離)
を想定して、トータル距離を取り、それが最少のノードを探索して行く。
各ノードの評価距離=出発点からの経路+ヒューリスティック距離
ヒューリスティック距離
(普通ユークリッド距離を取る )
3+14.23+13.8
G H
3
5+10.56+8.4
スパーシャル AI
空間解析
状況解析
位置検索技術
パス検索
スマートオブジェクト
など多数
影響マップ
など多数
プレイヤー予測経路(ゴールデンパス)
M. Jack , M. Vehkala, “Spaces in the Sandbox: Tactical Awareness in Open World Games,” GDC 2013,
https://ww.gdcvault.com/play/1018136/Spaces-in-the-Sandbox-Tactical
M. Jack , M. Vehkala, “Spaces in the Sandbox: Tactical Awareness in Open World Games,” GDC 2013,
https://ww.gdcvault.com/play/1018136/Spaces-in-the-Sandbox-Tactical
M. Jack , M. Vehkala, “Spaces in the Sandbox: Tactical Awareness in Open World Games,” GDC 2013,
https://ww.gdcvault.com/play/1018136/Spaces-in-the-Sandbox-Tactical
M. Jack , M. Vehkala, “Spaces in the Sandbox: Tactical Awareness in Open World Games,” GDC 2013,
https://ww.gdcvault.com/play/1018136/Spaces-in-the-Sandbox-Tactical
M. Jack , M. Vehkala, “Spaces in the Sandbox: Tactical Awareness in Open World Games,” GDC 2013,
https://ww.gdcvault.com/play/1018136/Spaces-in-the-Sandbox-Tactical
M. Jack , M. Vehkala, “Spaces in the Sandbox: Tactical Awareness in Open World Games,” GDC 2013,
https://ww.gdcvault.com/play/1018136/Spaces-in-the-Sandbox-Tactical
レベル
キャラクター AI
レベルを認識し、
自律的な判断を行い、
身体を動かす.
敵・味方
キャラクタ-
プレイヤー
情報獲得
スパーシャル AI
空間全般に関する思考
メタAI, キャラクター AIの為に
空間認識のためのデータを準備
ナビゲーション・データの管理
パス検索 戦術位置解析 オブジェクト認識
メタAI
エージェントを動的に配置
レベル状況を監視
エージェントに指示
ゲームの流れを作る
Order
Ask &
Report
ゲーム全体をコントロール
Support
query
query
頭脳として機能
MCS-AI動的
連携モデル(三宅 ,2020)