文献詳細
文献概要
多変量解析の応用・11
多変量データと分布論
著者: 古川俊之1 田中博1
所属機関: 1東京大学・医用電子研究施設
ページ範囲:P.1541 - P.1549
文献購入ページに移動はじめに
今回は観点を変えて,多変量解析法適用の共通の問題として分布論的観点から多変量データを検討する方法を述べる.多変量解析は本来記述的な手法で,単変量の統計学の推定や検定のようにデータの母集団の分布型を問題にすることは少ない.これは多変量解析のほとんどすべての手法が,データの統計的性質を相関係数行列に要約するところから始まり,それ以前の仔細なデータの分布状態の知識を形式上は必要としないためである.
しかし多変量解析法は原理的に言って,データが多変量正規分布に従うことを仮定して構成されており,またこの仮定が満たされるとき最も有効に働く.例えば,線型判別関数や重回帰式の予測の精度は,特性変量が正規分布に従うとき最も高くなる.それゆえ,分析が期待した精度を上げなかったときは,一度データの分布型を検討したほうがよい.その結果,ある変量xの簡単な変換,例えばlog xやx3によって正規分布に従うことが分かれば,変換を行ったデータを用いて分析したほうが理論的にも正当でありまた分析も有効になる.
今回は観点を変えて,多変量解析法適用の共通の問題として分布論的観点から多変量データを検討する方法を述べる.多変量解析は本来記述的な手法で,単変量の統計学の推定や検定のようにデータの母集団の分布型を問題にすることは少ない.これは多変量解析のほとんどすべての手法が,データの統計的性質を相関係数行列に要約するところから始まり,それ以前の仔細なデータの分布状態の知識を形式上は必要としないためである.
しかし多変量解析法は原理的に言って,データが多変量正規分布に従うことを仮定して構成されており,またこの仮定が満たされるとき最も有効に働く.例えば,線型判別関数や重回帰式の予測の精度は,特性変量が正規分布に従うとき最も高くなる.それゆえ,分析が期待した精度を上げなかったときは,一度データの分布型を検討したほうがよい.その結果,ある変量xの簡単な変換,例えばlog xやx3によって正規分布に従うことが分かれば,変換を行ったデータを用いて分析したほうが理論的にも正当でありまた分析も有効になる.
掲載誌情報