丸山 祐造 准教授 空間社会経済研究部門 2001- (個人ページ:: http://www.csis.u-tokyo.ac.jp/~maruyama/

モデル選択問題

重回帰分析において,説明変数の候補となる変数の中から最適な部分集合を選択することは,無駄な変数を入れることにより,予測力が悪くなることやモデルの解釈がしにくくなることを考えると,非常に重要な問題である.このとき,各説明変数の組ごとに一次元の指標を与え,その大きさにより最適な説明変数の組合せを選択することが自然であり,赤池情報量規準(AIC)やベイズ情報量規準(BIC)がその顕著な例である.しかし,これらの規準は,漸近的手法を使って導出しており,有限標本で必ずしも性能が良いわけではない.また,重回帰分析よりも一般的なモデルに対して用いられる規準であり,特に重回帰モデルの特徴を取り込んでいない.現在,ペンシルバニア大学統計学部のEdward George教授と共同で,重回帰モデルの回帰係数の推定問題において,良い性能を示す調和関数型事前分布及びその一般化分布を,モデル選択に応用するための研究を行っている.

リッジ回帰推定量を用いた空間予測量

統計学では近年バイアスのある推定量(あるいは予測量)を上手に使おうという非常に強い流れがある.ある予測量の分布が,真の値からずれた値を中心として分布する場合,真の値とずれた中心との差をバイアスといい,その予測量はバイアスがあるという.伝統的には,バイアスがない推定量,予測量の集合の中で良いものを探して,それを用いてきた.回帰分析における最小二乗推定量,空間予測における最良不偏予測量(最良不偏クリギング)は,その典型である.しかし,予測の目的を予測量と真の値との距離を小さくすることであると考えるとき,予測量の良さを距離の二乗の平均的な値(平均二乗誤差)で測ることが自然である.よく知られているように,

“予測量の平均二乗誤差 =「予測量のばらつき(分散)」 +「予測量のバイアスの二乗」”

であり,ばらつきとバイアスはトレードオフの関係にある.もし,バイアスのある予測量のばらつきが小さいならば,多少バイアスがあっても,平均二乗誤差は最良不偏予測量よりも小さい可能性がある.リッジ回帰推定量は,ばらつきが小さい推定量の典型であり,これをプラグインした予測量の性質を空間統計学の枠組で研究している.

小地域推定

標本調査において全体の母平均ではなく,調査区のような小さい単位の母平均を推定したい場合、通常の標本平均を推定量として用いると,標本が少ないために推定誤差が大きくなる.この欠点を解決するために基本的なアイデアは,隣接する調査区の標本の情報,あるいは全地域の標本の情報を適切な形で組み込むことであり,その方法論として知られる小地域推定問題を研究している.