政府統計を用いたEBPM研究プロジェクト

プロジェクトの概要と想定される成果・目標

日本は多数の上質な政府統計を実施していますが、欧米と比べて統計制度の利便性が低いため、公的ミクロデータを利活用したEBPM研究が極めて少ないことが課題となっています。。本研究は統計法改正とともに、情報セキュリティを確保したオンサイト施設において、公的ミクロデータを利用したEBPM研究を行っています。
また、本研究では政府統計ミクロデータを活用し、政策立案に有用な因果的Evidenceの発信を行っています。より効果的・効率的な政策を設計し、公的統計や行政情報で収集したデータを、国民生活の改善という形で還元することができます。

プロジェクトの背景

ハードサイエンス分野において、処置効果・因果効果を測定する際、ランダム化比較試験(Randomized controlled trial, RCT)が定番となっています。しかし、政策研究には法律・道徳・社会的慣習などの原因で、RCTを実施できないことが多いため、定量的な政策評価を非常に困難なものにしています。また、民間が保有するサーベイデータは一般的にプライバシー保護などの理由で、因果効果の識別に不可欠な個人情報(生年月日、居住地など)を公開することができません。

図1 ランダム化比較試験
プロジェクトでの研究・開発内容

政策研究では処置群と対照群をはっきり振り分けることができないため、従来の統計手法で識別する際、推定されたパラメーター (XがYに与える影響、𝛽)は共通の交絡因子Uの影響が混在し、ただ相関関係となっています。交絡因子Uの影響で人々は処置群と対処群の間に移行することができるのが特徴です。 定量的に政策評価するためには、人々を無作為・強制的に2つのグループに分ける必要があります。実証研究において、政策変遷、自然災害、天気事象などの自然実験に基づいたZ変数で、交絡因子Uと逆因果効果の影響を制御ことが必要です。
しかしながら、回帰不連続デザイン(Regression Discontinuity Design, RDD)、差の差推定(Differences-in-Differences)などの自然実験の手法で政策評価する際、政策介入の処置群と対照群を識別するには、詳細な個人情報が不可欠ですが、民間が保有する質の低いサーベイデータは高度な分析に向いていません。
そこで、本研究では、上質な政府統計データを使用することで、(1) RCTを使わず、統計的因果推論を行う、(2) 巨大な観測値で異質的な効果を探索する、(3) GIS分析でデータ可視化をすることを実現します。これらは、いずれもEBPMに有用な統計的Evidenceとして提示できるものとなります。

図2 因果効果の識別
図3 回帰不連続の例