Initialising ...
Initialising ...
Initialising ...
Initialising ...
Initialising ...
Initialising ...
Initialising ...
佐々木 明; 村田 真樹*; 柏木 裕恵*; 城 和貴*; Lukas, P.*; 加藤 太治*; 村上 泉*
no journal, ,
原子分子データは、基礎科学・産業分野の利用のためにデータベース化が行われている。従来は、原子分子物理学の専門家が論文として発表したデータを手作業で収集していたが、応用分野ではさらに多種,多量のデータが要求されるようになっている。そこでわれわれは、言語処理技術の応用による論文の収集やデータの抽出の自動化の支援と、作業の効率化の可能性を検討している。論文中の原子分子物理学に特徴的な専門用語,数式,化学式の認識と、これまでのデータベース作成を通して蓄積されている論文を教師データとした機械学習によるテキスト分類手法により、原子分子データが記述されている論文の識別を試みた結果について報告する。