言語情報の深層生成モテルを用いた株価動向推定

本研究では,深層生成モデルを用いてニュース記事から株価動向の日次予測を行う手法を提案する.複数ニュースそれぞれが持つ影響の大きさを考慮する.まずニュース記事が持つ情報を固定長のベクトルで表現するために,Paragraph Vectorと呼ばれる手法を用いる.これにより言語が持つ情報を十分に表現できる.次に株価情報と言語情報が持つ関係性を深層生成モデルで表現し,分散表現を基にパラメータを学習する.生成モデルを用いることにより,ニュース記事を生成する潜在変数や確率過程を表現でき,その表現に必要なパラメータの過学習を抑えることができる.実際に,日本市場とアメリカ市場の2市場を対象に,株価動向の2値分類を行い,本手法の有効性を示した.