文献詳細
Laboratory Practice 〈統計・データ処理 〉
文献概要
はじめに
医学領域では,過去の事例に基づく経験から知識の発見の研究を行っており,データマイニング(data mining)の手法を取り入れた研究は,すでに多くの研究者が実践しているといっても過言ではない.近年では,IT技術の進歩によって,大容量のデータを高速に処理できる基盤が整ったことで,誰もが容易に大規模な解析ができる時代となっている.
データマイニングとは,膨大なデータの中から有用な知識を発見するプロセスを総称した言葉である.蓄積されたデータの中からルールやパターンを抽出し,それらを可視化することで自明でない特徴を発見し,新たな仮説を導き出し,それらを検証することで効率的な探索を可能とする研究分野である.
医学分野で一般的に実施される臨床研究は,仮説をもとに厳密な対象の選択と研究計画を立案し,統計的な推定に基づく結論を導き出す方法が基本である.一方,あらかじめ明確な仮説を設定せず,日常的に集められた膨大なデータの中から知識を発見する方法も注目されはじめている.これが,最近注目されている“ビッグデータ”をキーワードとするデータマイニングの手法である.しかし,課題も多数存在し,収集したデータの精度が悪い場合や,欠損値だらけのデータを大量に集めても正しい結果を導き出すことが困難な問題がある.
本章では,臨床検査領域におけるデータマイニング研究とはどのようなものか,また,どのような課題があるのかを解説する.
医学領域では,過去の事例に基づく経験から知識の発見の研究を行っており,データマイニング(data mining)の手法を取り入れた研究は,すでに多くの研究者が実践しているといっても過言ではない.近年では,IT技術の進歩によって,大容量のデータを高速に処理できる基盤が整ったことで,誰もが容易に大規模な解析ができる時代となっている.
データマイニングとは,膨大なデータの中から有用な知識を発見するプロセスを総称した言葉である.蓄積されたデータの中からルールやパターンを抽出し,それらを可視化することで自明でない特徴を発見し,新たな仮説を導き出し,それらを検証することで効率的な探索を可能とする研究分野である.
医学分野で一般的に実施される臨床研究は,仮説をもとに厳密な対象の選択と研究計画を立案し,統計的な推定に基づく結論を導き出す方法が基本である.一方,あらかじめ明確な仮説を設定せず,日常的に集められた膨大なデータの中から知識を発見する方法も注目されはじめている.これが,最近注目されている“ビッグデータ”をキーワードとするデータマイニングの手法である.しかし,課題も多数存在し,収集したデータの精度が悪い場合や,欠損値だらけのデータを大量に集めても正しい結果を導き出すことが困難な問題がある.
本章では,臨床検査領域におけるデータマイニング研究とはどのようなものか,また,どのような課題があるのかを解説する.
参考文献
1)元田浩,津本周作,山口高平,他:データマイニングの基礎.オーム社,2006
2)加藤直樹,羽室行信,矢田勝俊:データマイニングとその応用.朝倉書店,2009
3)The Comprehensive R Archive Network (http://cran.r-project.org/)
4)金明哲:Rによるデータサイエンス.森北出版,2009
5)International Society of Nephrology : Notice. Kidney International Supplements 2:1,2012
6)Weber GM, Kohane IS : Extracting physician group intelligence from electronic health records to support evidence based medicine. PLoS ONE 8:e64933,2013
掲載誌情報