文献詳細
文献概要
特集 臨床検査のための情報処理技術の進歩 4章 臨床検査情報の収集とデータマイニング 2. 自動診断:classification
2)決定木(decision tree analysis)
著者: 横山茂樹1
所属機関: 1高電工業株式会社インフォメディカル事業部
ページ範囲:P.1439 - P.1443
文献購入ページに移動はじめに
決定木(けっていぎ,decision tree)は分類や予測を行う場合によく使用される手法であり,あるターゲットとなる項目(目的変数)を説明する重要な要因(説明変数)を,ある“基準”に基づき分類し自動抽出する手法で,決定木生成アルゴリズムとしては,CHAID,CART,C5.0などを用いるデータマイニングの中心的手法の1つである.
現在,医療施設では臨床検査データ,診療記録データ,インシデントデータなどの大量データが蓄積されている.決定木は,このような医療分野の事例データの中から特徴や規則を抽出する手法として幅広く利用されている1~3).
また,感染症制御分野においても,MRSA感染,熱傷感染症,菌交代,耐性菌感染などのリスク因子解析のため,決定木,相関ルールなどにより感染症制御データベースの中から,感染症制御に役立つリスク因子を抽出することができる4~6,9).
近年,データベースの大容量化・高速化に伴い,リレーショナルデータベース(RDB)とデータマイニングを統合し,決定木をRDBで表現することで,SQLクエリによる多角的探索や,臨床検査医学領域の知識発見支援システムへの応用が可能となり,大規模なデータマイニングを実施できるようになった7,8).
本稿では感染症制御データベースからのサンプルデータを基に,決定木について解析例などを交えてわかりやすく説明する.
決定木(けっていぎ,decision tree)は分類や予測を行う場合によく使用される手法であり,あるターゲットとなる項目(目的変数)を説明する重要な要因(説明変数)を,ある“基準”に基づき分類し自動抽出する手法で,決定木生成アルゴリズムとしては,CHAID,CART,C5.0などを用いるデータマイニングの中心的手法の1つである.
現在,医療施設では臨床検査データ,診療記録データ,インシデントデータなどの大量データが蓄積されている.決定木は,このような医療分野の事例データの中から特徴や規則を抽出する手法として幅広く利用されている1~3).
また,感染症制御分野においても,MRSA感染,熱傷感染症,菌交代,耐性菌感染などのリスク因子解析のため,決定木,相関ルールなどにより感染症制御データベースの中から,感染症制御に役立つリスク因子を抽出することができる4~6,9).
近年,データベースの大容量化・高速化に伴い,リレーショナルデータベース(RDB)とデータマイニングを統合し,決定木をRDBで表現することで,SQLクエリによる多角的探索や,臨床検査医学領域の知識発見支援システムへの応用が可能となり,大規模なデータマイニングを実施できるようになった7,8).
本稿では感染症制御データベースからのサンプルデータを基に,決定木について解析例などを交えてわかりやすく説明する.
参考文献
1) Adriaans P, Zantinge D:Data Mining, Addison-Wesley, 1996
2) Fayyad UM, et al:Advances in Knowledge Discovery and Data Mining, AAAI Press, 1996
3) 松岡喜美子,横山茂樹:データマイニング手法と医療過誤.臨床検査 46:573-577,2002
4) 横山茂樹,津本周作,松岡喜美子,他:細菌検査データベースからのデータマイニング.第16回ファジィシステムシンポジウム企画セッションラフ集合.日本ファジィ学会,pp475-478,2000
5) Yokoyama S, Matsuoka K, Tsumoto S, et al:Study on the association between the patients' clinical background and the anaerobes by data mining in infectious diseases database. Biomedical Fuzzy and Human Sciences 7:69-75,2001
6) 松岡喜美子,横山茂樹:医療リスクマネジメント-感染症制御情報編(1)―医療データマイニングによる感染症検査データ解析―.医療と検査機器・試薬 25:11-21,2002
7) 片岡浩己,杉浦哲朗:決定木のRDB表現と知識探索支援システム.情報処理学会研究会会誌データベース 71:107-114,2001
8) 片岡浩己:臨床検査領域におけるデータマイニング.日本臨床検査自動化学会誌 26:689-696,2001
9) Hirata K, Shima Y, Harao M, et al:Disjunctive rules extracted from MRSA data with verification. Proc CME 2005:326-330, 2005
10) Matsuoka K, Yokoyama, S, Tsumoto S, et al:Analysis of MRSA infection backbround factors by using data mining. Proc CME 2005:331-334, 2005
11) Yokoyama S, Mori T:Data Mining Software “ICONS Miner” for Medical Data Analysis. Proc CME 2005:335-340, 2005
掲載誌情報