検索対象:     
報告書番号:
※ 半角英数字
 年 ~ 
 年
検索結果: 3 件中 1件目~3件目を表示
  • 1

発表形式

Initialising ...

選択項目を絞り込む

掲載資料名

Initialising ...

発表会議名

Initialising ...

筆頭著者名

Initialising ...

キーワード

Initialising ...

使用言語

Initialising ...

発行年

Initialising ...

開催年

Initialising ...

選択した検索結果をダウンロード

論文

アブストラクトを用いた原子分子物理学分野の論文分類支援システムの設計と実装

柏木 裕恵*; 高田 雅美*; 佐々木 明; 城 和貴*

情報処理学会論文誌; 数理モデル化と応用(インターネット), 48(SIG15), p.189 - 198, 2007/10

原子分子データベースの構築に必要となる、科学論文から原子分子データを収集する過程の自動化支援の手法の研究を行った。インターネットなどで閲覧可能な論文のアブストラクトの中から、これまでのデータベース活動で収集された論文のアブストラクトの集合を教師データとする機械学習手法(学習ベクトル量子化法:LVQ)を用い、原子分子データを含む論文を抽出する方法について、原子分子物理分野の固有表現,専門用語など論文の特徴をよく表すと予想された情報を活用して、分類の性能の評価を行った。最適化の結果、精度82%,再現率13%が得られたが、原子分子データを含む論文が全論文中の1%以下であることから、実用化のためには適切な専門用語辞書を構築するなどによってさらに精度を高める必要があると考えられる。

論文

Design and implementation of an evolutional data collecting system for the atomic and molecular databases

佐々木 明; 城 和貴*; 柏木 裕恵*; 渡辺 知恵美*; 鈴木 学*; Lucas, P.*; 大石 雅寿*; 加藤 太治*; 加藤 雅敏*; 加藤 隆子*

Journal of Plasma and Fusion Research SERIES, Vol.7, p.348 - 351, 2006/00

原子分子データベースは基礎科学,産業応用で利用されているが、広い分野からの需要を満たすには、現在手作業に頼っているデータ収集,評価を効率化することが不可欠である。われわれは、従来の原子データベースの構築の方法を分析し、原子分子データが記載されている論文の収集,論文中の重要データの抽出,具体的な図表のデータの読み取り,数値化の3つの段階に分け、コンピュータの活用による作業の効率化の方法の検討を行った。まず、論文の収集に関しては、多くの学術雑誌がオンライン化されていることを利用し、アブストラクトを自動的に収集することができる。次に、核融合研などにこれまでに蓄積されている、原子分子データが記載されている論文との類似性を計算することで、収集された論文の中から原子分子データが記載されている論文を選びだすことができると考えられる。本研究では、参照アブストラクトとの類似性のためにLVQ(Learning Vector Quantization)法によるテキスト分類の方法を用い、用意されたサンプルが原子分子データを含む論文かどうかの適合性を判定する実験を行い、結果の評価を行う。本研究は、会津大,奈良女子大,核融合研のグループが論文ダウンロードソフトの開発,テキスト分類ソフトの開発評価,参照用データの提供等の各要素を分担して行う。

口頭

科学論文からの原子分子データの収集,データベース化の自動化支援に関する研究

佐々木 明; 村田 真樹*; 柏木 裕恵*; 城 和貴*; Lukas, P.*; 加藤 太治*; 村上 泉*

no journal, , 

原子分子データは、基礎科学・産業分野の利用のためにデータベース化が行われている。従来は、原子分子物理学の専門家が論文として発表したデータを手作業で収集していたが、応用分野ではさらに多種,多量のデータが要求されるようになっている。そこでわれわれは、言語処理技術の応用による論文の収集やデータの抽出の自動化の支援と、作業の効率化の可能性を検討している。論文中の原子分子物理学に特徴的な専門用語,数式,化学式の認識と、これまでのデータベース作成を通して蓄積されている論文を教師データとした機械学習によるテキスト分類手法により、原子分子データが記述されている論文の識別を試みた結果について報告する。

3 件中 1件目~3件目を表示
  • 1