文献詳細
文献概要
多変量解析の応用・7
クラスター分析
著者: 古川俊之1 田中博1
所属機関: 1東京大学・医用電子研究施設
ページ範囲:P.809 - P.817
文献購入ページに移動はじめに
クラスター分析は,主成分分析や因子分析と同様,外的基準を設けずデータの内部構造を分析する手法である.この手法ではデータを構成する個体問,あるいは特性変量問に定義された類似度あるいは距離を手掛かりにいわゆる似た物同士を集め,全体を幾つかの集落(クラスター)に分割する.それゆえ手法は個体や特性変量群を分類する目的で用いられることが最も多いが,分析の観点からデータ構造を明らかにする意味でも用いることができる.例えば因子分析などによってもどうしても解釈できない結果が得られるようなとき,クラスター分析を適用すると,一様と考えられていた対象が実は異なった二つの集団であったことが分かる場合がある.
その意味で多変量解析法を適用する前に,まずクラスター分析によって個体間,特性変量間の親近関係をあらかじめ明らかにしておくことを勧める専門家も少なくない1),クラスター分析で留意しなければならない点は,分析を始める前に使用する類似度やクラスター構成法の特徴を知っておくことである.すなわち,分析者が個体間あるいは特性変量間に与える類似性の定義,あるいはクラスター構成法の種類によって幾とおりもの結果が存在することである.本解説では,どの多変量プログラムパッケージにも用意されている代表的クラスター分析について,その特徴とプログラム使用法を述べたい.
クラスター分析は,主成分分析や因子分析と同様,外的基準を設けずデータの内部構造を分析する手法である.この手法ではデータを構成する個体問,あるいは特性変量問に定義された類似度あるいは距離を手掛かりにいわゆる似た物同士を集め,全体を幾つかの集落(クラスター)に分割する.それゆえ手法は個体や特性変量群を分類する目的で用いられることが最も多いが,分析の観点からデータ構造を明らかにする意味でも用いることができる.例えば因子分析などによってもどうしても解釈できない結果が得られるようなとき,クラスター分析を適用すると,一様と考えられていた対象が実は異なった二つの集団であったことが分かる場合がある.
その意味で多変量解析法を適用する前に,まずクラスター分析によって個体間,特性変量間の親近関係をあらかじめ明らかにしておくことを勧める専門家も少なくない1),クラスター分析で留意しなければならない点は,分析を始める前に使用する類似度やクラスター構成法の特徴を知っておくことである.すなわち,分析者が個体間あるいは特性変量間に与える類似性の定義,あるいはクラスター構成法の種類によって幾とおりもの結果が存在することである.本解説では,どの多変量プログラムパッケージにも用意されている代表的クラスター分析について,その特徴とプログラム使用法を述べたい.
掲載誌情報