プレイヤーの技量をエンハンスする「ゲームの人工知能」を教育分野に第138回オンラインシンポレポート・前半

プレイヤーの技量をエンハンスする「ゲームの人工知能」を教育分野に
第138回オンラインシンポレポート・前半

活動報告｜レポート

2023.11.17 Fri

プレイヤーの技量をエンハンスする「ゲームの人工知能」を教育分野に</br>第138回オンラインシンポレポート・前半

概要

超教育協会は2023年10月4日、ゲームAI研究者・開発者、工学博士　三宅陽一郎氏を招いて「AIがもたらす教育の未来と可能性」と題したオンラインシンポジウムを開催した。

シンポジウムの前半では三宅氏が、自らの研究テーマであるゲームのAIについて説明し、教育分野への応用の可能性について言及した。後半では、超教育協会理事長の石戸奈々子をファシリテーターに、視聴者からの質問を織り交ぜながら質疑応答が実施された。その前半の模様を紹介する。

＞＞　後半のレポートはこちら
＞＞　シンポジウム動画も公開中！Youtube動画

「AIがもたらす教育の未来と可能性」

■日時：2023年10月4日（水）

■講演：三宅陽一郎氏
ゲームAI研究者・開発者、工学博士

■ファシリテーター：石戸奈々子
超教育協会理事長

三宅氏は約30分の講演において、人間そのものを再構成する研究ともいえるゲームの人工知能について説明し、プレイヤーの技量を増幅（エンハンス）する「メタAI」の教育分野への応用の可能性についても自らの見解を語った。

ゲームの人工知能を作るとは人間を細分化して再構成すること

ゲームの人工知能に関する研究とは、ゲームの中のモンスターや仲間のキャラクターの「頭の中を作る」ための研究です。過去25年ぐらいで盛り上がってきた比較的新しい分野で、世の中には知られていない技術の宝庫でもあります。

最近のゲームは、三次元空間の中でさまざまなキャラクターが動き、魔法を撃ったり武器を使ったりしながら、それぞれのキャラクターに搭載された人工知能の考えで戦うような構成になっています。

▲　スライド1・現代のゲームは
3D空間の中でキャラクターが自分で考えて動く

The Illusion of Intelligence – Bungie.net Downloads
http://downloads.bungie.net/presentations/
gdc02_jaime_griesemer.ppt
（ ↑ クリックするとすぐにダウンロード 14.3MB）

1980年代になると、プレイヤーが操作するキャラクターの動きを見ながら反応する人工知能が作られ、キャラクターに搭載されるようになりました。

ゲームの人工知能を作るという私の研究は、人間そのものを再構成するような研究です。人間という存在を生物学や医学、物理学、デザイン、CG、アルゴリズムなどさまざまな視点から分解し、それらを「もう一度組み合わせて」人工知能を作ります。そのため、人間を取り巻くあらゆる領域にわたって勉強する必要があります。

▲　スライド2・人工知能は「人間」を
細分化してあらゆる学問に分類し、
再度組み合わせて作る

煩悩を植えつけ「学習」させるゲームは人工知能育成の箱庭

人工知能には、人間のようには煩悩がありません。人間のように何か食べたい、休みたい、眠りたいといった欲求がないからです。しかし、ゲームの人工知能にはキャラクターを「生物っぽく」動かすために、わざと煩悩を植えつけます。「〇〇が憎い」、「リンゴを食べたい」、「仲間を守りたい」といった執着をどんどん与えていきます。仏教用語でいうと「堕落させる」のです。仏教では煩悩を滅して解脱するという考え方がありますが、ゲームの人工知能の研究では逆に煩悩を与えていくのです。

▲　スライド3・ゲームのキャラクターを
生物のように見せるために
人工知能に煩悩を与える

あるキャラクターの人工知能に「プレイヤーを倒す」という煩悩を植えつけておくと、プレイヤーを倒そうと自ら学習します。最初は下手ですが、試行錯誤するうちに上手に人間を倒すように学習していきます。これは強化学習という方法です。例えば、うまく攻撃できたときに褒めてあげると、人工知能は「自分は今、良いことをした」と理解し、徐々に上手くなっていきます。これが「人工知能の学習」です。

▲　スライド4・よい動きをしたときに褒めると、
人工知能はその動きが上手になっていく

Ralf Herbrich, Thore Graepel, Joaquin Quiñonero Candela
Applied Games Group,Microsoft Research Cambridge
“Forza, Halo, Xbox Live The Magic of Research in Microsoft Products”
http://research.microsoft.com/en-us/projects/drivatar/ukstudentday.pptx

もう少し凝った強化学習の例を紹介します。鬼ごっこをする人工知能の例で、赤が追う側の鬼、青が追われる側とした場合、青が赤に捕まってしまうと終わりです。これを1万回ぐらい繰り返すと、青が、「箱を使って入口を塞ぐと、鬼が入ってこられない」ことを学習します。追われる側が完全勝利となるのです。

https://www.youtube.com/watch?v=kopoLzvh5jY
▲　スライド5・人工知能が育つ様子。
同じことを数万回繰り返すと
解決策を見つけて学んでいく

Emergent Tool Use From Multi-Agent Autocurricula　(2019)
Bowen Baker, Ingmar Kanitscheider, Todor Markov, Yi Wu, Glenn Powell, Bob McGrew, Igor Mordatch
https://arxiv.org/abs/1909.07528

その後、さらに1万回ぐらい続けると、あるときふと負け続けていた赤い鬼の人工知能が「横の三角形の台を使えば、登って上から入れる」ことを見つけます。さらに1万回後には、青の方が「入口を塞ぐ前に三角形の台を内側に移動させれば、鬼が入ってこられない」ことを学習します。

https://www.youtube.com/watch?v=kopoLzvh5jY
▲　スライド6・一方が
「勝つ」状況になった後も、
もう一方がそれを打ち負かす学習を繰り返す

OpenAI, Emergent tool use from multi-agent interaction
https://openai.com/blog/emergent-tool-use/

この例では勝つ方法を発見していくのに時間がかかるのですが、人工知能は段階的に学習していきます。これがディープラーニングです。

こう考えるとゲームは「人工知能を育てる箱庭」でもあります。ゲームの中は時間を加速させることができますので、人間の時間の100年分ぐらいを一気に学習させることが可能です。例えばもし人間にも100年ぐらい旗取りゲームばかりさせたら誰でもうまくなります。同様に人工知能も、学習することによってうまくなっていくのです。

仏教ではすでに1000年前に「知能の構造」を唯識論で示していた

人工知能とは変わった学問です。特にゲームの人工知能の研究とは、アルゴリズムで演算するだけではなく、仮想空間の中で仮想人間を作るようなもので、「環境の中で知能ができていく」という考え方が成り立つことになります。環境から独立して知能があるわけではありません。自分を取り巻く環境の中でどううまく生きていけるか、そのような人工知能をどうやって作るかを考えています。

▲　スライド7・仮想空間で
シミュレーションを繰り返し、
環境の中で動くAIを作っていく

環境と知能がどうつながるかについては、人工知能の深いテーマです。例えばこの世界のことを隅から隅まで完全に理解していれば、正確に行動できて理想的ですが、実際は人間も世界のことをよく理解してはいないでしょう。例えば、ニュートン力学が分かったのは300年前ぐらいですが、その前の時代の人たちも「手を離したら物は下に落ちる」、「太陽は東からのぼりに西に沈む」と知っていて生きていました。つまり、知識が必ずしも活動に役に立つわけではなく、知能によって環境との関わりがうまくつながれば、「良い感じ」に行動できるのです。

▲　スライド8・知能は、
環境とうまく関わることさえできれば、
うまく行動できる

環境と知能をつなぐ理論は、生物学では「環世界」、情報科学の世界では「エージェントアーキテクチャ」、仏教の世界では「華厳哲学」と言います。

▲　スライド9・人工知能と
環境をとりまくさまざまな理論

知能は、層構造になっています。例えば意識と無意識。我々はほとんど無意識で行動しています。ペットボトルを掴むとき、どの指が最初にボトルに触れるかを知らなくても、無意識でボトルを掴むことができます。無意識も一つの知能なのです。意識の中にも自意識、さらに無意識の下には身体があります。身体の下には世界があり、ピラミッド型で世界、身体、知能のてっぺんに意識があるレイヤ構造になっています。

▲　スライド10・「知能」を表した図。
ピラミッド型の層構造になっている

仏教では1000年前から「唯識論」があります。この唯識の階層構造の一番下は、物事がそのまま入ってきて、あるがまま受け入れる層です。これを阿頼耶識と言います。識とは層のことです。次の「末那識」には自分と世界を分ける意識が生まれてきます。その次が「意識」で、その次が目や耳からの「五識」です。

このように「唯識」は、人工知能でいう層構造になっています。仏教は1000年前から知能のモデルをきちんと提示していたのです。人工知能は仏教に比べて1000年ぐらい後のものだということになります。知能のことは仏教の方がよく分かっているという見識も吸収しながら、人工知能がどうできていくのかを研究しています。

▲　スライド11・人工知能を作るための元となる
「識」の層は仏教の「唯識論」でも示されている

モンスターの人工知能を作るときモンスターにとっての「環世界」を考える

次に生物学での捉え方です。生物学では生物の持つ主観的世界のことを「環世界」と言います。生物がそれぞれに持っている主観的世界のことで、各生物が自ら勝手に捉えている世界です。「昔あそこで足をひねったからあそこは通りたくない」、「トマトが嫌い」などは主観的で、情報の捉え方が環世界です。

生物はそれぞれ主観世界を持ち、その世界を通じて行動しています。主観世界は公正かつ正確な世界ではなく、偏ってはいますが、最終的に行動がうまくできればそれで良いのです。

人間も生物も、長い進化の中で環境と自分自身の関係を築いてきました。世界には無限の情報があり、人間は自分に必要な情報を無限の世界から切り取り、集約して有限な自分の主観世界を作って生きています。水を見たら飲める、パンを見たら食べられると頭で考える前に、目の前に自分の欲求に応じた世界を組み立てています。それがさきほどの唯識論が示そうとしていることです。

それを生物学的にいうと、例えばリンゴを見たら「食べられるもの」と認識して自然に唾液が出るように、特定の対象から特定の情報を得て、主観世界として理屈なく体が反応する。これが環世界です。

人工知能を作るときも、とても客観的な情報をたくさん集めて判断します。将棋や囲碁もの指し手を考えるときもそうです。しかし体を動かすときは、そんなことは考えません。むしろ間違っていてもよいから主観世界の中で身体運動を形成します。それが環世界です。

▲　スライド12・環世界における
人間の体の反応の関係の仕組み

私はモンスターを作るときも、モンスターにとっての環世界は何だろうと考えます。6本足で羽があるモンスター、この生物はこの世界をどう捉えているのか、を考えます。そのモンスターの環世界さえうまく作れれば、行動は比較的簡単に作れるのです。

▲　スライド13・人工知能と環境を
とりまくさまざまな理論

仏教の「華厳哲学」では、物事はすべて響き合っているとされています。我々は環境というと頭や五感で捉えると考えますが、実はそうではなく、例えば足が地面に着くことで足の状態によって環境を理解しています。腕、皮膚、髪の毛、身体のあらゆる部分を通じていろんな世界と関連しあっているのです。風が吹いたときの髪の毛のバサバサ具合で風の強さが分かる、皮膚がどれぐらいべたつくかで湿気が分かる、など全てのものがすべてのものと響きあっているというのが、華厳哲学の教えることです。

人工知能なので脳を再現する、ように作ればよいというのではなく、身体と世界との関係を考えるのです。足が知っている世界、皮膚が知っている世界がそれぞれあります。ようするに、環世界も情報科学のエージェントアーキテクチャも華厳哲学も、同じことを言っています。情報の場合は情報がぐるぐる回っているという捉え方、環世界の場合は主観世界がそこに立ち上がっている。華厳哲学は体も何もかも響き合っている、このようなことを考えながら人工知能を作っています。

▲　スライド14・華厳哲学の
時事無碍の考え方を表した図

機械に「人間を理解させる」役割を担う「メタAI」とは

専門的な話になりますが、ゲームは3つの人工知能から成っています。このうち「メタAI」という面白い概念について説明します。「メタAI」はプレイヤーをずっと見ていて、プレイヤーの上手い、下手を判断するゲームの世界では「神様AI」です。そして下手なプレイヤーには、敵の数を減らすのです。

▲　スライド15・3つのAIから成る
ゲームのAIの構造と役割のまとめ

ゲームの人工知能の研究では、「知能を作る」というミッションのほかにもうひとつ「機械に人間を理解させる」という大きなミッションがあります。そうでなければ、人工知能が暴走して、人間を傷つけたときに、「痛いです」と言っても分かってくれないことになります。そんな人工知能は危なくて使えません。だから、人間は腕をひねったら痛いし、火が近づいたらやけどをする、といったことを機械に理解してもらわなければなりません。

ゲームも、最近はユーザーがどれぐらい緊張しているか、いつリラックスしているか、プレイログを解析して把握しています。そして一番リラックスしているときに、敵を数多く出すといったことをします。「このユーザーはゲームにもう飽きている」、あるいは「今はやる気満々だ」ということを理解して、それに応じてゲームの内容を変えるのです。ゲーム側がユーザーをいかに理解して、いかにゲームをコントロールしていくか、これがメタAIのミッションです。

最近の大きなゲームにはこのAIが入っています。この人はどんな人なのかな、魔法を撃ちたいのかな、剣でモンスターをバシバシ叩きたいのかな、と見極めて、剣で叩くのが好きなら、そのようなモンスターを比較的多めに出そうとか、コンテンツをどんどん変えていくのがメタAIです。

▲　スライド16・ユーザーが
ゲームをより楽しめるように分析し、
ゲームをコントロールするメタAI

Michael Booth, “The AI Systems of Left 4 Dead,” Artificial Intelligence and Interactive Digital Entertainment Conference at Stanford.

教育分野を含めてこれまでのいろいろなコンテンツは、コンテンツに人間が合わせていました。昔のゲームもゲームに人間が合わせていました。しかし人工知能があれば180度逆なのです。コンテンツ側が人間に合わせる。AIが人間を理解して、その人に与えるコンテンツ、教材、ゲーム、映像をどんどん変えていくのがメタAIの考え方です。

＞＞　後半へ続く

プレイヤーの技量をエンハンスする「ゲームの人工知能」を教育分野に
第138回オンラインシンポレポート・前半