強化学習と教師あり学習を用いた人間らしく振る舞うゲームAIの構築
深層Qネットワークと呼ばれる手法を用いて構築された人工知能(AI)が、ビデオゲームなど分野において人間の能力をも凌駕することが可能となった。機械学習の一種である強化学習では、人間には不可能な反射能力などを使って行動する不自然で不公平なAIが作成されることがある。一方、教師あり学習では人間の様に自然に振る舞うAIを構築することができる。ゲームAIの能力の高さと振る舞いの自然さは同時に実現されるべきゲームAIの特性である。 本研究では、強化学習と教師あり学習を融合させることによって、ゲームAIの能力の高さと振る舞いの自然さを両立する手法を提案する。評価実験では、融合モデルによって構築されたAIの能力に関する実験とチューリングテストを行い、従来手法との差を明らかにした上で、提案手法が能力の高さと振る舞いの自然さを兼ねたAIを構築できることを示した。
![](http://www.ai.cs.kobe-u.ac.jp/wp/wp-content/uploads/2017/06/ddf450575bf64ebf5512cb0284482475.png)
![](http://www.ai.cs.kobe-u.ac.jp/wp/wp-content/uploads/2017/06/e5bb4f1dfd76ec8adf2564bc2f33ff0f.png)
![](http://www.ai.cs.kobe-u.ac.jp/wp/wp-content/uploads/2017/06/6b5b50b8b2579613da43109baead0b18.png)
![](http://www.ai.cs.kobe-u.ac.jp/wp/wp-content/uploads/2017/06/aa29ac2f6fe731208772e3520c61e280.png)