文献詳細
特集 臨床検査のための情報処理技術の進歩
4章 臨床検査情報の収集とデータマイニング 2. 自動診断:classification
2)決定木(decision tree analysis)
著者: 横山茂樹1
所属機関: 1高電工業株式会社インフォメディカル事業部
ページ範囲:P.1439 - P.1443
文献概要
決定木(けっていぎ,decision tree)は分類や予測を行う場合によく使用される手法であり,あるターゲットとなる項目(目的変数)を説明する重要な要因(説明変数)を,ある“基準”に基づき分類し自動抽出する手法で,決定木生成アルゴリズムとしては,CHAID,CART,C5.0などを用いるデータマイニングの中心的手法の1つである.
現在,医療施設では臨床検査データ,診療記録データ,インシデントデータなどの大量データが蓄積されている.決定木は,このような医療分野の事例データの中から特徴や規則を抽出する手法として幅広く利用されている1~3).
また,感染症制御分野においても,MRSA感染,熱傷感染症,菌交代,耐性菌感染などのリスク因子解析のため,決定木,相関ルールなどにより感染症制御データベースの中から,感染症制御に役立つリスク因子を抽出することができる4~6,9).
近年,データベースの大容量化・高速化に伴い,リレーショナルデータベース(RDB)とデータマイニングを統合し,決定木をRDBで表現することで,SQLクエリによる多角的探索や,臨床検査医学領域の知識発見支援システムへの応用が可能となり,大規模なデータマイニングを実施できるようになった7,8).
本稿では感染症制御データベースからのサンプルデータを基に,決定木について解析例などを交えてわかりやすく説明する.
参考文献
掲載誌情報