MDL 原理に基づいた
Boosting アルゴリズムの精度の改善


AdaBoost に代表されるBoosting アルゴリズムは、任意の学習アルゴリズム(弱学習アルゴリズム)に複数の仮説を出力させて、それらを最終的にひとつに統合することによって分類精度を改善するアルゴリズムである。このように複数の仮説による分類結果を一つに統合する際に、それぞれの仮説に対して、その分類結果の正しさの指標となる信頼度を設定し、さらなる分類精度の改善を行う方法が提案されている。本研究では、弱学習アルゴリズムとして、代表的な決定木生成アルゴリズムである C4.5 を用いた AdaBoost において、生成された各決定木に対して信頼度を設定し、分類精度の改善を図っている。この信頼度を計算する際に、決定木の節点のうち、どの節点において信頼度を計算するか、ということを MDL 原理にしたがって決定し、最も確からしい信頼度を計算する。
途中経過