Initialising ...
Initialising ...
Initialising ...
Initialising ...
Initialising ...
Initialising ...
Initialising ...
柏木 裕恵*; 高田 雅美*; 佐々木 明; 城 和貴*
情報処理学会論文誌; 数理モデル化と応用(インターネット), 48(SIG15), p.189 - 198, 2007/10
原子分子データベースの構築に必要となる、科学論文から原子分子データを収集する過程の自動化支援の手法の研究を行った。インターネットなどで閲覧可能な論文のアブストラクトの中から、これまでのデータベース活動で収集された論文のアブストラクトの集合を教師データとする機械学習手法(学習ベクトル量子化法:LVQ)を用い、原子分子データを含む論文を抽出する方法について、原子分子物理分野の固有表現,専門用語など論文の特徴をよく表すと予想された情報を活用して、分類の性能の評価を行った。最適化の結果、精度82%,再現率13%が得られたが、原子分子データを含む論文が全論文中の1%以下であることから、実用化のためには適切な専門用語辞書を構築するなどによってさらに精度を高める必要があると考えられる。