文献詳細
文献概要
基礎から応用へ
統計学的思考・7
著者: 土肥一郎1
所属機関: 1中央鉄道病院内科
ページ範囲:P.29 - P.30
文献購入ページに移動1.平均値と分散
今回からは連続量の取り扱いについて解説する.連続量とは身長とか体重とか血中濃度のようなもので,例えば145cmと146cmとの間に,理論的には無数の身長の値が存在しうるという意味で,何事かの起こる回数が例えば4回の次は5回というように,トビトビになっているのとは事情が異なっている.
この連続量について例えば男と女との群の比較をするというような場合,厳密な意味ではその対象とする量が正規分布することが必要である.すなわち,量xの分布が,
(式省略)
に従うことが成り立っていなくてはならない.mは母集団平均,σ2は母集団分散である.ここに分散というのは,もし,xがx1からx10までの10個であるなら,
(式省略)
として求められるものである.このs2を標本分散というが,母集団分散(または母分散)とは,母集団について求めた分散のことで,現実に我々が手に入れる資料からは,ある方法で推定することができるだけのものである.通常は分散不偏推定量(不偏分散という)を求めるが,これは,
(式省略)
として求められる.xはx1からx10までの平均値である.s2を求める式の右辺を見れば直観的に理解されるように,測定値が平均値の周りにバラツク程度が大きいと,s2は大きくなるから,分散はデータのバラツキの大きさを測る尺度になっていると考えてよい.
今回からは連続量の取り扱いについて解説する.連続量とは身長とか体重とか血中濃度のようなもので,例えば145cmと146cmとの間に,理論的には無数の身長の値が存在しうるという意味で,何事かの起こる回数が例えば4回の次は5回というように,トビトビになっているのとは事情が異なっている.
この連続量について例えば男と女との群の比較をするというような場合,厳密な意味ではその対象とする量が正規分布することが必要である.すなわち,量xの分布が,
(式省略)
に従うことが成り立っていなくてはならない.mは母集団平均,σ2は母集団分散である.ここに分散というのは,もし,xがx1からx10までの10個であるなら,
(式省略)
として求められるものである.このs2を標本分散というが,母集団分散(または母分散)とは,母集団について求めた分散のことで,現実に我々が手に入れる資料からは,ある方法で推定することができるだけのものである.通常は分散不偏推定量(不偏分散という)を求めるが,これは,
(式省略)
として求められる.xはx1からx10までの平均値である.s2を求める式の右辺を見れば直観的に理解されるように,測定値が平均値の周りにバラツク程度が大きいと,s2は大きくなるから,分散はデータのバラツキの大きさを測る尺度になっていると考えてよい.
掲載誌情報