nimnim's blog @統合牧場

おもにライフサイエンスデータベース統合TVのめも日記です。BioやScienceに興味がある小学生〜大人の方までどうぞご覧ください。 普段は細菌とたわむれています。(・▽・)。【分子細菌学/togotv/サイエンスデータベース】統合牧場から放牧中です。

130927 MicrobeDBのつかいかた

調査中です。

 

ー以下調査メモー

<使用データベース>

Environment

・MEO

微生物の生息環境に関するメタデータを記述し整理するためのオントロジーであるMEO (Metagenome/Microbes Environmental Ontology)のOWLファイルと,公共のメタゲノムデータのメタデータをMEO相手にマッピングしてサンプルごとに整理した結果のRDFファイルの2つから構成されたDB。

 

Strain

次回調査

 

 

<参考>

BioPortal

http://bioportal.bioontology.org/ontologies/MEO

 

ライフサイエンスデータベース統合推進事業・統合化推進プログラムの詳細]

http://biosciencedbc.jp/tec-dev-prog/rdprog-over

 

MicrobeDB.jp

本DBは,微生物に関する多種多様な情報を遺伝子・系統・環境の3つの軸に沿って整理統合し,セマンティックWeb技術を利用して単一の検索ウィンドウからそれらの情報を検索可能な統合DBです。

by http://biosciencedbc.jp/db-link/d04-dblink

 

<fromポスター>

要旨

・数学的基盤が乏しいライフサイエンス研究において、 知識の集積体であるデータベース (DB) は、 知識の参照のみにとどまるものではなく、 新たな研究分野を切り拓く上で欠く事の出来ない極めて重要な研究基盤である。

・ライフサイエンス研究の中でも、 微生物研究は歴史も古く、 これまで蓄積されたデータや知識は膨大かつ多岐にわたっている。 

・ゲノム科学の発展や新型シーケンサーの普及に伴い、 ゲノムやメタゲノムなど圧倒的な量のデータが産出されており、 これらを横断的にかつ簡便に利用出来れば、 新たな仮説や研究分野の創出がより容易になると期待される。

・ゲノム情報を核として様々な微生物学上の知識を統合し、 幅広い分野での微生物学の発展に資することのできる 「微生物エンサイクロペディア」 の構築を目標として研究開発を行っている。 

・これらのデータの統合化は、 微生物の体系的な理解を促進し、 これまでの仮説検証型の研究のみならず、 膨大なデータの中から新たな仮説を導くデータ駆動型の研究を強力に推進する事を可能とする。

 

 

微生物研究における問題点

多様性に富んだ膨大なデータがあるものの、 それらのデータをシームレスに利用する事が困難

 

本研究開発の目標

ゲノム情報を核として様々な微生物学上の知識を統合

→幅広い分野での微生物学の発展に資することのできる 「微生物エンサイクロペディア」 の構築を目標

 

研究開発概要

・世界中に散在している細菌の各種オミックス情報を広く収集

・上記データをホモロジー、 オーソロジーに基づいて整理し、遺伝子、 ゲノム ( 生物種 )、 環境の3つの軸に沿って整理統合

・3つの軸に関わる、 遺伝子機能、 分類学的情報、 菌株保存情報、表現型情報などの知識を整理し、 ゲノム情報を核として統合

・広く研究者コミュニティからのフィードバックを得るための仕組みを開発

・研究者が活用しやすいインターフェース等を整備

 

目標とするデータベース

・まず研究基盤となる 6 項目の DB を整備し、個々の DB をゲノム情報を核としてセマンティック技術でシームレスに連携する

1. 分類学的情報 (16S rDNA を含む )

2. 菌株保存情報 ( 培養条件含む )

3. モデル微生物 ( 大腸菌、 枯草菌、 シアノバクテリア、放線菌)における高品質データ

4. 各種オミックスデータ

5. オーソログ遺伝子情報

6. メタゲノムデータ

 

研究開発実施体制

東京工業大学

国立遺伝学研究所

基礎生物学研究所

DBCLS(技術アドバイザー)

 

メタゲノム DB およびメタデータの構築

・メタゲノムデータの整理

→Sequence Read Archive (SRA) のデータを SRS ID を用いてサンプルごとに整理

・各メタゲノムサンプルのメタデータの整理

→SRA のメタゲノム /16S データの集計結果

メタデータのカテゴリの例

両方 ・ Metagenome/16S ・ Collection Date ・ Project Name ・ Sequencer

ヒト ・ Age ・ Body Habitat ・ Country ・ Diet ・ Disease stage ・ Family Relationship

環境 ・ pH ・ Depth ・ Dissolved Oxygen ・ Temperature ・ Total Nitrogen ・ Wind Speed

 

文献情報に基づくキュレーションによるモデル微生物の高品質データ

→文献情報に基づく高品質なモデル微生物のアノテーション情報がオーソロジーに基づいて他の微生物のゲノム情報と関連付けられる

 

文献情報に基づくキュレーションによるモデル微生物の高品質データ

・文献情報に基づく高品質なモデル微生物のアノテーション情報がオーソロジーに基づいて他の微生物のゲノム情報と関連付けられる

 

MicrobeDB.jp における遺伝子 , 系統 , 環境情報の統合

・関連 DB 間の統合のイメージ図

・関連 DB 間の遺伝子の ID 対応関係

・関連 DB 間のゲノムの ID 対応関係

→様々な DB のデータを RDF/OWL 等のセマンティック Web の技術を用いて統合

 

Microbedb_Ontology

遺伝子⇔系統⇔環境

 

微生物関連データベース

MicrobeDB.jp

本DBは,微生物に関する多種多様な情報を遺伝子・系統・環境の3つの軸に沿って整理統合し,セマンティックWeb技術を利用して単一の検索ウィンドウからそれらの情報を検索可能な統合DBです。

CyanoBase(MicrobeBase)

シアノバクテリアに代表される酸素発生型光合成細菌とその関連バクテリアのゲノム情報を集積したデータベースです。

etc...

http://biosciencedbc.jp/db-link/d04-dblink