Deep Human-like Behavior – 上原研究室 | 神戸大学大学院システム情報学研究科

強化学習と教師あり学習を用いた人間らしく振る舞うゲームAIの構築

深層Qネットワークと呼ばれる手法を用いて構築された人工知能(AI)が、ビデオゲームなど分野において人間の能力をも凌駕することが可能となった。機械学習の一種である強化学習では、人間には不可能な反射能力などを使って行動する不自然で不公平なAIが作成されることがある。一方、教師あり学習では人間の様に自然に振る舞うAIを構築することができる。ゲームAIの能力の高さと振る舞いの自然さは同時に実現されるべきゲームAIの特性である。　本研究では、強化学習と教師あり学習を融合させることによって、ゲームAIの能力の高さと振る舞いの自然さを両立する手法を提案する。評価実験では、融合モデルによって構築されたAIの能力に関する実験とチューリングテストを行い、従来手法との差を明らかにした上で、提案手法が能力の高さと振る舞いの自然さを兼ねたAIを構築できることを示した。