icon fsr

文献詳細

雑誌文献

生体の科学54巻5号

2003年10月発行

文献概要

特集 創薬ゲノミクス・創薬プロテオミクス・創薬インフォマティクス 第2部 総説 Ⅲ 創薬インフォマティクス

文献データベースからの生医学インフォマティクス

著者: 武田浩一1 浦本直彦1 松澤裕史1 猪口明博1 村上明子1

所属機関: 1日本アイ・ビー・エム株式会社東京基礎研究所

ページ範囲:P.443 - P.448

文献購入ページに移動
 大量文書からの知識発見を目指すテキストマイニングの手法は,構造化されていない文字列として表現されたテキストから,単語,固有表現(遺伝子,タンパク質の名称など),係受け(「Aが+Bを+抑制する」といった関係など)といった多様なレベルの情報抽出と,それらの要素間の統計的な分析によるパターンや傾向の発見を可能にした。ライフサイエンス分野では,約1,200万件の論文アブストラクトおよび書誌データを含むMEDLINE文献データベースや,同分野に現れる概念と用語を体系化したUMLSというシソーラスが広く利用可能であるため,近年になってテキスト情報に基づくインフォマティクスの中心的課題として非常に研究が盛んになってきた。

 本稿では,このようなライフサイエンス分野におけるテキストマイニングの研究動向を,特に情報抽出技術を中心として概説するとともに,著者らの研究する特徴語分析,傾向分析,相関分析といったマイニング手法とそれを統合したシステムについて述べる。

参考文献

1)Hearst M:“Untangling Text Data Mining”(invited paper), Proc. ACL'99, June, 1999
2)Tsujii J, Ananiadou, S:An Introduction to Information Extraction, tutorial at PSB'01, Jan., 2001
3)Fukuda K et al:Toward information extraction:Identifying protein names from biological papers, Proc. ISMB'98, Jan., 1998
4)Schwartz A, Hearst M:A Simple Algorithm for Identifying Abbreviation Definitions in Biomedical Text, Proc. PSB'03, Jan., 2003
5)Pustejovsky J et al:Robust Relational Parsing over Biomedical Literature:Extracting Inhibit Relations, Proc. PSB'02, Jan., 2002
6)Thomas J et al:Automatic extraction of protein interactions from scientific abstracts, Proc. PSB'00, Jan., 2000
7)Humphreys K et al:Automatically Extracting Enzyme Interaction and Protein Structure Information from Biological Science Journal Articles, Proc. AISB'00, 2000
17(suppl 1):2001
9)Hosaka J et al:Effect of utilizing terminology on extraction of protein-protein interaction information from biomedical literature, Proc. EACL'03, 2003
10)Stapley B et al:Predicting the Sub-Cellular Location of Proteins from Text Using Support Vector Machines, Proc. PSB'02, Jan., 2002
11)Ng S, Wong M:Toward routine automatic pathway discovery from on-line scientific text abstracts, Proc. GIW'99, 1999
12)Dickerson J et al:Creating metabolic network models using text mining and expert knowledge, Proc. CBGIST'00, 2000
13)Takeda K:MedTAKMI:Text Mining from the Entire MEDLINE Database(oral presentation only), Proc. VLDB'02, Aug., 2002

掲載誌情報

出版社:株式会社医学書院

電子版ISSN:1883-5503

印刷版ISSN:0370-9531

雑誌購入ページに移動
icon up
あなたは医療従事者ですか?