ESRI Discussion Paper No.345
計量テキスト分析による景気判断
-コーディングルールや主成分を使った時系列分析-

2018年3月
山澤成康
内閣府経済社会総合研究所上席主任研究官

要旨

景気ウォッチャー調査の文章情報を使い、計量テキスト分析で景気動向の把握や予測法を検討した。「景気判断理由集(現状)」に使われる約19万件の文章から単語を抽出し、その単語が各月の総文章数に対してどれくらい出現するか(出現率)を集計して時系列データとして使用した。分析は、(1)コーティングルールを使った分析(2)相関分析(3)主成分分析(4)GDP予測への応用──に分かれている。

コーディングルールを使った分析では、分析者が作成した単語の組み合わせ(コーディングルール)に従って出現率を計算して、グラフ化した。政策効果などがわかりやすく示せることがわかった。

相関分析では、景気ウォッチャー調査の現状判断DIと各単語の出現率の相関係数をとり、どのような単語の相関係数が高いかを調べた。景気に順相関あるいは逆相関する単語を選び、景気指標を作成した。

主成分分析では、頻出150語の出現率を時系列データとみなし、主成分を抽出した。ウエートの高い語やその語と同時に使用される語などを検討して、各主成分がどのような性質を持っているのかを検討した。第1主成分が、景気ウォッチャー調査の現状判断DIや景気動向指数・一致指数との相関が高いことがわかった。

GDP予測への応用では、近似ダイナミックファクターモデルなどを使用して、実質GDP成長率が予測できるかどうかを検討した。説明変数として、鉱工業生産指数のほか単語の出現率や主成分を用いると、予測精度が上がることがわかった。

  • JEL 分類番号:E32
  • キーワード:景気循環、テキスト分析、景気ウォッチャー調査

全文ダウンロード

計量テキスト分析による景気判断—コーディングルールや主成分を使った時系列分析—別ウィンドウで開きます。(PDF形式 1.49 MB)

全文の構成

  1. 1ページ
    要旨
  2. 2ページ
    1. はじめに
    1. 2ページ
      計量テキスト分析とは
    2. 2ページ
      先行研究
      1. 3ページ
        表1 テキストデータを利用した指標例
    3. 4ページ
      本論文の問題意識
  3. 4ページ
    2. コーディングルールを使った分析
    1. 4ページ
      データについて
    2. 5ページ
      コーディングルールとは
      1. 5ページ
        表2 コーディングルールを使った分析
    3. 5ページ
      コーディングルールによる時系列データ
      1. 7ページ
        図1 コーディングルールによる出現率
  4. 8ページ
    3. 相関分析による景気指標の作成
    1. 8ページ
      景気版「感情極性対応表」の作成
      1. 9ページ
        表3 景気の現状判断DI(方向性)との相関ランキング
      2. 10ページ
        図2 現状判断DIとテキストデータから作ったインデックス(Text Index)
    2. 10ページ
      否定語などに関する検証
      1. 10ページ
        表4 言葉と景況感の関係が複雑な場合
      2. 11ページ
        図3 否定助動詞「ない」が出現する比率
  5. 12ページ
    4. テキストデータの主成分分析
    1. 14ページ
      図4 主成分分析の結果
    2. 14ページ
      表5 各主成分の固有ベクトル(絶対値の大きい順)
    3. 15ページ
      表6 主成分と経済指標の相関係数
    4. 15ページ
      図5 第1主成分と景気ウォッチャー調査現状判断DI(方向性)
  6. 15ページ
    5. GDPの予測への応用
    1. 16ページ
      テキストをそのまま説明変数とする場合
    2. 17ページ
      近似ダイナミックファクターモデル
      1. 18ページ
        表7 推計結果(その1)
    3. 18ページ
      推計結果
      1. 20ページ
        表8 推計結果(その2)
      2. 21ページ
        図6(その1) 実質GDPの予測値
      3. 22ページ
        図6(その2) 実質GDPの予測値(続き)
  7. 22ページ
    おわりに
  8. 23ページ
    参考文献
  9. 25ページ
    付注1
    1. 26ページ
      付図1 主成分ごとの共起ネットワーク
      1. 26ページ
        第1主成分
      2. 26ページ
        第2主成分
      3. 27ページ
        第3主成分
      4. 27ページ
        第4主成分
      5. 28ページ
        第5主成分
      6. 28ページ
        第6主成分
    2. 29ページ
      付図2 主成分のグラフ(表7の式3)
    3. 30ページ
      付図3 主成分のグラフ(表7の式4)
  • 〒100-8914
    東京都千代田区永田町1-6-1 中央合同庁舎第8号館
  • 電話 03-5253-2111(代表)