ハイパーネットによる畳み込みニューラルネットワークの暗黙的事後分布推定

ニューラルネットワークは複雑な表現を学習することができ,様々なタスクで高い性能を示している.しかし,学習に利用できるデータは限られているため,過学習を起こしやすい.過学習を防ぐためにニューラルネットワークの学習を正則化することは,最も重要な課題の1つである.本研究では,大規模な畳み込みニューラルネットワークを対象とし,ハイパーネットを用いて,パラメータの事後分布を暗黙的に推定することで学習を正則化する.また,パラメータの分布が学習されることから,モデル平均化により識別精度を向上させることができる.

本研究は総務省 戦略的情報通信研究開発推進事業(SCOPE)の委託を受けて行われた.