文献詳細
文献概要
特集 臨床検査のための情報処理技術の進歩 4章 臨床検査情報の収集とデータマイニング 1. 自動分類:clustering
2)自己組織化マップ
著者: 片岡浩巳1
所属機関: 1高知大学医学部附属病院検査部
ページ範囲:P.1427 - P.1432
文献購入ページに移動はじめに
自己組織化マップ(Self-Organizing Maps;SOM)1)は,非常に強力なクラスタリング能力を持った解析法の1つで,Kohonenによって考案された技術である.SOMによる解析は,膨大なデータの中に潜むパターンを見つけ出す目的に適用することができる.また,パターンの類似性に応じた距離関係も視覚的に見ることができる.SOMは教師なし競合学習および近傍学習を基本原理としたクラスタリングアルゴリズムで,入力層と競合層の2層で構成されたニューラルネットワークの構造を持った機械学習システムである.競合層は特徴地図と呼ばれる2次元の地図が出力でき,複数のパターンが存在する膨大なデータを入力することにより,代表的なパターンを特徴地図上に展開できる.また,類似性の高いパターンが収束した結果を得られることから,パターンの解析や類似性の解析に優れた方法である.このほか,SOMの基本原理を発展させて開発された学習ベクトル量子化(Learning Vector Quantization:LVQ)2)がある.これはSOMを単純化し統計的クラス分類に応用したアルゴリズムで,クラスタリングではなく分類に属する教師あり学習システムである.本章ではLVQには触れず,SOMの基本原理の解説と,研究者向けのプログラムパッケージの利用法を紹介する.
自己組織化マップ(Self-Organizing Maps;SOM)1)は,非常に強力なクラスタリング能力を持った解析法の1つで,Kohonenによって考案された技術である.SOMによる解析は,膨大なデータの中に潜むパターンを見つけ出す目的に適用することができる.また,パターンの類似性に応じた距離関係も視覚的に見ることができる.SOMは教師なし競合学習および近傍学習を基本原理としたクラスタリングアルゴリズムで,入力層と競合層の2層で構成されたニューラルネットワークの構造を持った機械学習システムである.競合層は特徴地図と呼ばれる2次元の地図が出力でき,複数のパターンが存在する膨大なデータを入力することにより,代表的なパターンを特徴地図上に展開できる.また,類似性の高いパターンが収束した結果を得られることから,パターンの解析や類似性の解析に優れた方法である.このほか,SOMの基本原理を発展させて開発された学習ベクトル量子化(Learning Vector Quantization:LVQ)2)がある.これはSOMを単純化し統計的クラス分類に応用したアルゴリズムで,クラスタリングではなく分類に属する教師あり学習システムである.本章ではLVQには触れず,SOMの基本原理の解説と,研究者向けのプログラムパッケージの利用法を紹介する.
参考文献
1) Kohonen T:Self-Organizing Maps. Springer, 1995
2) Kohonen T:Learning vector quantization. In M. Arbib, editor, The Handbook of Brain Theory and Neural Networks. pp537-540, MIT Press, 1995
3) Sakoe H, et al:Dynamic programming algorithm optimization for spoken word recognition, IEEE Trans. Acoust. Speech Signal Processing, ASSP-26, 1, pp43-49, 1978
4) R Development Core Team (2005). R:A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL http://www.R-project.org.
5) 岡田昌史:The R Bookデータ解析環境Rの活用事例集.九天社,2004
6) 舟尾暢男:The R Tipsデータ解析環境Rの基本技・グラフィックス活用集.九天社,2005
7) 片岡浩巳:臨床検査技師のための実践データベース論・第11章 データベースプログラミング.検査と技術 35:1421-1426,2005
8) 片岡浩巳,小西修:動的計画法―SOMに基づく類似検索システム.情報処理 42:SIG10(TOD11),92-99,2001
掲載誌情報