Initialising ...
Initialising ...
Initialising ...
Initialising ...
Initialising ...
Initialising ...
Initialising ...
佐々木 明; 城 和貴*; 柏木 裕恵*; 渡辺 知恵美*; 鈴木 学*; Lucas, P.*; 大石 雅寿*; 加藤 太治*; 加藤 雅敏*; 加藤 隆子*
Journal of Plasma and Fusion Research SERIES, Vol.7, p.348 - 351, 2006/00
原子分子データベースは基礎科学,産業応用で利用されているが、広い分野からの需要を満たすには、現在手作業に頼っているデータ収集,評価を効率化することが不可欠である。われわれは、従来の原子データベースの構築の方法を分析し、原子分子データが記載されている論文の収集,論文中の重要データの抽出,具体的な図表のデータの読み取り,数値化の3つの段階に分け、コンピュータの活用による作業の効率化の方法の検討を行った。まず、論文の収集に関しては、多くの学術雑誌がオンライン化されていることを利用し、アブストラクトを自動的に収集することができる。次に、核融合研などにこれまでに蓄積されている、原子分子データが記載されている論文との類似性を計算することで、収集された論文の中から原子分子データが記載されている論文を選びだすことができると考えられる。本研究では、参照アブストラクトとの類似性のためにLVQ(Learning Vector Quantization)法によるテキスト分類の方法を用い、用意されたサンプルが原子分子データを含む論文かどうかの適合性を判定する実験を行い、結果の評価を行う。本研究は、会津大,奈良女子大,核融合研のグループが論文ダウンロードソフトの開発,テキスト分類ソフトの開発評価,参照用データの提供等の各要素を分担して行う。