Cross-domain Transfer Clustering
by Target Constrained Representation Learning

深層学習の発展により、教師あり学習は非常に高い性能を示すようになっている。 しかし、現在の機械学習モデルは未学習のクラスには適用できず、教師データなしで高い性能を実現するのも難しい。

近年の研究で、転移学習を用いることにより、クラスタリングの性能が大きく向上することがわかった。しかし、既存の転移クラスタリング手法は、転移元と転移先が類似するクラスであるという、“Same-domain 仮定”に強く依存している。そのため、既存手法は、転移元に類似するクラスがない場合、うまく機能しないことが予想される。

本研究では、この点に着目し、転移クラスタリングに Cross-domain という新しい概念を導入する。 Cross-domain 設定では、既存研究と異なり、転移元に類似するクラスが存在しないと仮定する。 そして、Cross-domain 設定において有効な手法として、Target Constrained Representation Learning を提案する。 この手法は、特徴抽出器の事前学習時に、転移元データの教師あり学習に加えて、転移先データの教師なし学習を同時に行う。 転移先データの教師なし学習によって転移先データの重要な特徴が抽出され、転移元データの教師あり学習によってクラス分類に役立つ特徴が抽出されることで、転移先データのクラスタリングに適した特徴が得られることが期待される。

実験では、まず、本研究で導入された Cross-domain 設定と、既存研究が扱う Same-domain 設定の比較を行い、Cross-domain 設定の特殊さを示した。 次に、Cross-domain 設定で、提案手法の有効性を示し、転移元データの教師あり学習と転移先データの教師なし学習を組み合わせることが重要であることも確かめた。