検索対象:     
報告書番号:
※ 半角英数字
 年 ~ 
 年

Coverage of whole proteome by structural genomics observed through protein homology modeling database

タンパク質立体構造ホモロジーモデリングデータベースからみえる構造ゲノミックスよる全タンパク質構造の解明情況

由良 敬; 山口 昌太*; 郷 通子*

Yura, Kei; Yamaguchi, Akihiro*; Go, Michiko*

ゲノム塩基配列から推定される全ORFがコードするタンパク質の立体構造をホモロジーモデリング法により可能な限り推定しデータベース(FAMSBASE)を構築してきた。現在FAMSBASEには368724ORF由来のタンパク質の立体構造が格納されている。FAMSBASEに格納されているタンパク質立体構造の年次変化を調べることで、全生物の全タンパク質の立体構造がいつ判明するかが推定できる。その結果原核生物の全タンパク質立体構造は15年後に、真核生物の全タンパク質立体構造は25年後にホモロジーモデリングが可能になることがわかった。

We have been developing FAMSBASE, a protein homology-modeling database of whole ORFs predicted from genome sequences. The latest update of FAMSBASE (http://daisy.nagahama-i-bio.ac.jp/Famsbase/), which is based on the protein three-dimensional (3D) structures released by November 2003, contains modeled 3D structures for 368,724 open reading frames (ORFs) derived from genomes of 276 species. Those 276 genomes are predicted to have 734,193 ORFs in total and the current FAMSBASE contains protein 3D structure of approximately 50% of the ORF products. Assuming that this rate would be maintained, whole soluble protein model structures of prokaryotes without the putative disordered regions will be in hand within 15 years. For eukaryotic proteins, they will be in hand within 25 years.

Access

:

- Accesses

InCites™

:

Altmetrics

:

[CLARIVATE ANALYTICS], [WEB OF SCIENCE], [HIGHLY CITED PAPER & CUP LOGO] and [HOT PAPER & FIRE LOGO] are trademarks of Clarivate Analytics, and/or its affiliated company or companies, and used herein by permission and/or license.