nimnim's blog @統合牧場

おもにライフサイエンスデータベース統合TVのめも日記です。BioやScienceに興味がある小学生〜大人の方までどうぞご覧ください。 普段は細菌とたわむれています。(・▽・)。【分子細菌学/togotv/サイエンスデータベース】統合牧場から放牧中です。

130927 MicrobeDBのつかいかた

調査中です。

 

ー以下調査メモー

<使用データベース>

Environment

・MEO

微生物の生息環境に関するメタデータを記述し整理するためのオントロジーであるMEO (Metagenome/Microbes Environmental Ontology)のOWLファイルと,公共のメタゲノムデータのメタデータをMEO相手にマッピングしてサンプルごとに整理した結果のRDFファイルの2つから構成されたDB。

 

Strain

次回調査

 

 

<参考>

BioPortal

http://bioportal.bioontology.org/ontologies/MEO

 

ライフサイエンスデータベース統合推進事業・統合化推進プログラムの詳細]

http://biosciencedbc.jp/tec-dev-prog/rdprog-over

 

MicrobeDB.jp

本DBは,微生物に関する多種多様な情報を遺伝子・系統・環境の3つの軸に沿って整理統合し,セマンティックWeb技術を利用して単一の検索ウィンドウからそれらの情報を検索可能な統合DBです。

by http://biosciencedbc.jp/db-link/d04-dblink

 

<fromポスター>

要旨

・数学的基盤が乏しいライフサイエンス研究において、 知識の集積体であるデータベース (DB) は、 知識の参照のみにとどまるものではなく、 新たな研究分野を切り拓く上で欠く事の出来ない極めて重要な研究基盤である。

・ライフサイエンス研究の中でも、 微生物研究は歴史も古く、 これまで蓄積されたデータや知識は膨大かつ多岐にわたっている。 

・ゲノム科学の発展や新型シーケンサーの普及に伴い、 ゲノムやメタゲノムなど圧倒的な量のデータが産出されており、 これらを横断的にかつ簡便に利用出来れば、 新たな仮説や研究分野の創出がより容易になると期待される。

・ゲノム情報を核として様々な微生物学上の知識を統合し、 幅広い分野での微生物学の発展に資することのできる 「微生物エンサイクロペディア」 の構築を目標として研究開発を行っている。 

・これらのデータの統合化は、 微生物の体系的な理解を促進し、 これまでの仮説検証型の研究のみならず、 膨大なデータの中から新たな仮説を導くデータ駆動型の研究を強力に推進する事を可能とする。

 

 

微生物研究における問題点

多様性に富んだ膨大なデータがあるものの、 それらのデータをシームレスに利用する事が困難

 

本研究開発の目標

ゲノム情報を核として様々な微生物学上の知識を統合

→幅広い分野での微生物学の発展に資することのできる 「微生物エンサイクロペディア」 の構築を目標

 

研究開発概要

・世界中に散在している細菌の各種オミックス情報を広く収集

・上記データをホモロジー、 オーソロジーに基づいて整理し、遺伝子、 ゲノム ( 生物種 )、 環境の3つの軸に沿って整理統合

・3つの軸に関わる、 遺伝子機能、 分類学的情報、 菌株保存情報、表現型情報などの知識を整理し、 ゲノム情報を核として統合

・広く研究者コミュニティからのフィードバックを得るための仕組みを開発

・研究者が活用しやすいインターフェース等を整備

 

目標とするデータベース

・まず研究基盤となる 6 項目の DB を整備し、個々の DB をゲノム情報を核としてセマンティック技術でシームレスに連携する

1. 分類学的情報 (16S rDNA を含む )

2. 菌株保存情報 ( 培養条件含む )

3. モデル微生物 ( 大腸菌、 枯草菌、 シアノバクテリア、放線菌)における高品質データ

4. 各種オミックスデータ

5. オーソログ遺伝子情報

6. メタゲノムデータ

 

研究開発実施体制

東京工業大学

国立遺伝学研究所

基礎生物学研究所

DBCLS(技術アドバイザー)

 

メタゲノム DB およびメタデータの構築

・メタゲノムデータの整理

→Sequence Read Archive (SRA) のデータを SRS ID を用いてサンプルごとに整理

・各メタゲノムサンプルのメタデータの整理

→SRA のメタゲノム /16S データの集計結果

メタデータのカテゴリの例

両方 ・ Metagenome/16S ・ Collection Date ・ Project Name ・ Sequencer

ヒト ・ Age ・ Body Habitat ・ Country ・ Diet ・ Disease stage ・ Family Relationship

環境 ・ pH ・ Depth ・ Dissolved Oxygen ・ Temperature ・ Total Nitrogen ・ Wind Speed

 

文献情報に基づくキュレーションによるモデル微生物の高品質データ

→文献情報に基づく高品質なモデル微生物のアノテーション情報がオーソロジーに基づいて他の微生物のゲノム情報と関連付けられる

 

文献情報に基づくキュレーションによるモデル微生物の高品質データ

・文献情報に基づく高品質なモデル微生物のアノテーション情報がオーソロジーに基づいて他の微生物のゲノム情報と関連付けられる

 

MicrobeDB.jp における遺伝子 , 系統 , 環境情報の統合

・関連 DB 間の統合のイメージ図

・関連 DB 間の遺伝子の ID 対応関係

・関連 DB 間のゲノムの ID 対応関係

→様々な DB のデータを RDF/OWL 等のセマンティック Web の技術を用いて統合

 

Microbedb_Ontology

遺伝子⇔系統⇔環境

 

微生物関連データベース

MicrobeDB.jp

本DBは,微生物に関する多種多様な情報を遺伝子・系統・環境の3つの軸に沿って整理統合し,セマンティックWeb技術を利用して単一の検索ウィンドウからそれらの情報を検索可能な統合DBです。

CyanoBase(MicrobeBase)

シアノバクテリアに代表される酸素発生型光合成細菌とその関連バクテリアのゲノム情報を集積したデータベースです。

etc...

http://biosciencedbc.jp/db-link/d04-dblink

 

 

 

 

130924 Microbe DB_調査中

Springer Exemplarをtogotv curatedにあげましたのでどうぞご活用ください。

Microbe DB調査中です。

 

 

 

ー以下メモー

Microbe DB(微生物エンサイクロペティア)

http://mdb.bio.titech.ac.jp/

・説明

独立行政法人 科学技術振興機構のライフサイエンスデータベース統合推進事業・統合化推進プログラムに採択されたプロジェクト「ゲノム・メタゲノム情報を基盤とした微生物DBの統合」についてのページです。

Open Source Content Management System Ploneを使用。

 

Plone

・・・Zopeアプリケーションサーバ上に構築されたフリーかつオープンなコンテンツマネジメントシステム。

基本的にPloneは、ブログ、インターネットサイト、ウェブショップや組織内のWebサイトといったどのような用途にも利用可能。

さらに文書管理システムやグループウェアといった共有ツールとしても利用できる。

Ploneの強みは、その柔軟で適応性のあるワークフロー、非常に優れたセキュリティ、拡張性、高いユーザビリティと柔軟性である。

 

・例

Gene: psbA

Taxonomy(分類学): Streptococcus glycerinaceus (連鎖球菌)

Mapping(対応付け): Escherichia coli O157:H7 str. Sakai

Environment(環境): hot spring (温泉)

SRS(small ruminant ruminal pH measurement system; SRS): rumen (Rumen is the first chamber in the alimentary canal of ruminant animals.反芻動物の消化管の最初の室のこと。)

Strain(種): Bifidobacterium (ビフィズス菌、グラム陰性偏析嫌気性桿菌)

Disease(病気): Cholera (コレラ)

MiGap(Microbial Genome Annotation Pipeline: http://www.migap.org/ ): GAF

 

※MiGap

・・・微生物ゲノム解析において定評あるデータベースと定評あるアルゴリズムを組み合わせたアノテーション実行パイプライン

MiGAPには,デフォルト解析の初級用のブロンズ(b-MiGAP),パラメーターを設定可能とする中級用シルバー(s-MiGAP),さらにデータベースやアルゴリズムを付加することができる上級用のゴールド(g-MiGAP)の3つのレベルが用意してある。

MiGAPを利用するにはまず国立遺伝学研究所の「Webサービス利用アカウント」を取得する必要がある。

入手したアカウントとパスワードを使用してMiGAPにログインすることができる。

 

・リソース数

調査中。

・リファレンスに対するリソースのマッピング

調査中。

・help

under construction!

 

・sign inでできること

systemerror!

 

・類似DB 

Bio Resouce World@NBRP http://resourcedb.nbrp.jp/top.jsp

GBIF http://uat.gbif.org/

Zipcodezoo.ocm http://zipcodezoo.com/Bacteria/S/Streptococcus_glycerinaceus/

MiGAP:  http://www.migap.org/ 

 

※Bio Resouce World

・・・BioResourceWorldは生物実験材料(バイオリソース)の総合検索サイトです。ナショナルバイオリソースプロジェクト---情報中核機関が活動の一環として試作しているものです。

 

<Microbedb説明参照サイト>

http://events.biosciencedbc.jp/article/04

http://integbio.jp/dbcatalog/record/nbdc01181

 

 

無料英文著者向けサービス「Springer Exemplarの使い方」の動画アップしました

o(・ω・o)Springer Exemplarの使い方o(・ω・o)

本家 http://togotv.dbcls.jp/20130920.html

youtubeはこちらです。http://www.youtube.com/watch?v=YyOnE7TCz5I&feature=youtu.be

Springer Exemplarは電子ジャーナル出版社シュプリンガー(Springer)社が運営する無料の英文論文の著者向けサービスです。

学術論文中の特定の単語やフレーズが、どのような文脈・用法で使用されているのかをシュプリンガーの1900誌以上のジャーナルから検索することができます。

出版年、ジャーナル、国、分野別などで検索フレーズの絞り込みができ、それらのトレンドも知ることができます。分野は医学を始め、ライフサイエンス、工学、数学、ビジネス、法学など多岐にわたり、対象論文は全て査読済みです。

Springer Exemplarは単語や短いフレーズの検索には不向きですが、長いフレーズ、特に5、6ワード以上の検索に真価を発揮します。英語の単語や短いフレーズの検索には、文献中の英語表現を検索するサービスinMeXesが有用です。

 

 英語表現を検索するサービスSplinger Exemplarは、検索フレーズの年、分野、国別などで絞込みができ、検索フレーズのトレンドもわかります。(´ω`*)

また検索対象の論文が全て査読済みになっています。(*・▽・*)

 

長いフレーズ(5,6 word以上)の検索では検索結果が多く、比較しやすいです。ヾ|*´・ω・|/

 

どうぞご活用ください。(^^*)

 

<長いフレーズ検索結果一例>

*springerの検索結果
can be expected to occur at :31
can be expected to occur at least :3

We have established a method for:23
We have established a method :58

is a major determinant of :3079
is a important determinant of :5536
is a prime determinant of :45
is a primary determinant of :353
is a dominant determinant of :18
is a cardinal determinant of :2
is a magistral determinant of :0
is a paramount determinant of :3
is a premier determinant of :0
is a principal determinant of :40

is a major determinant of the distribution of :5

is the only current method to diagnose :1

*inMexesの検索結果
can be expected to occur at :0
can be expected to occur :候補フレーズ2(しかしLSDでは検出されず)
can be expected to :ある程度検出される

*比較
year
subject
country

→年ごと、国別、分野別などで比較できる

 

<使い分け>

inMeXes

・・単語や短いフレーズ検索時に。(軽快に検索できる)

・・短いフレーズの前後関係(前置詞など)を調べたいときに。

Splinger Exemplar

・・長いフレーズ検索時に。(検索数が多い)

・・検索したいフレーズが最近使用されているかを調べるときに。

・・分野別、国別、publication、publication typeでどのくらいの頻度で使用されているかをみて、クオリティーの高い英文を書くときに。【トレンド】

(inMeXesでは用例はでるが、ひと目でそのフレーズがその分野で使用されているのか、英語圏で使用されているのかがわからない。)

 

 

130723 Springer Exemplar筋書き修正

Springer Exemplarの筋書き決定。次回撮影と編集作業に入ります。



筋書き

@@@@@修正@@@@@

・Springer Exemplar説明

・be expected

・inMeXes,be expected、前置詞、詳細はこちらのTVで

・inMeXes,Numerous attempts have been made to

・Springer Exemplar検索:Numerous attempts have been made to(328)

・適したツールですね!

・簡単にレビュー(オプション)

・私ライフサイエンス分野、ライフサイエンス選択

・オープンアクセス選択

・論文とぶ

・com+F、Numerous attempts have been made to

終了

 

・コメント

宣伝部分は最初に説明。

オプション機能は最後に説明。

 

 

ーーーーーー以下廃案ーーーーーーーーーーーーーーー

→文献中の英語表現を軽快に検索するサービスinMeXesがある。

→inMeXesで検索:Numerous attempts have been made to(フレーズ出現回数50)

→使用頻度を調べたい。(inMeXesでは面倒。)そうだ。Springer Exemplarを使ってみよう!

→スプリンガーの説明

→Springer Exemplar検索:Numerous attempts have been made to(328)

→最近の使用率、分野、国別、publication、pblication type、、、、

→結果:最近の使用頻度は悪くない。USAでもメジャーで使われているらしい。分野もマッチしてるしOK。論文でも使用頻度が高い。

→左側はファセット検索になっている。

*→USAを選択

*→この表現を使用しているUSAのグループがどのsubject、publicationに多く投稿しているかなどわかる。

→論文にカーソルを合わせるだけで、ジャーナルの表紙・タイトル・著者も確認。

*→Open Accessを指定すると無料で読める論文のみを抽出することも!

→ジャーナルへ飛ぶ。

→(注意)springer検索「be expected(to be)(as) 」 などの短い単語やフレーズは検索に時間がかかる。(この場合はinMeXesをおすすめする。)5・6字以上のフレーズ検索がお勧め。

*(inMeXesで”be expected”を検索→springerで検索)

Springer:専門分野の論文を執筆の際に、使用率を考慮してクオリティーの高い英語表現を使用するときにぜひご活用ください。

→Springerぜひご活用ください。

*入れるか検討*

 

Springer Exemplar 調査・筋書・検討

Springer Exemplarの調査

 

ー以下調査内容のメモです。ー

【メリット】

・最近使用されているかや、分野別、国別、publication,publication typeでどのくらいの頻度で使用されているかをみて、クオリティーの高い英文を書くときに使用している。byいぬさん

(inMeXesでは用例はでるが、ひと目でそのフレーズがその分野で使用されているのか、英語圏で使用されているのかがわからない。)

・論文がカーソルをあわせるだけですぐ確認できるところ。

 

【デメリット】

・単語:検索に時間がかかる

・フレーズ前後は見難い。(フレーズ前後の例はinMeXesの方が使いやすい。)

 

【使い方】

1.inMeXesでフレーズの用例を調べる

2.出てこない→MEDLINEセンテンスで論文を辿れるが、そのフレーズがメジャーで使われているのか、その使用頻度はわからない。

3.splinger で検索→最近の使用率、国別、分野別で使用頻度を確認。

4.他のフレーズを使ってみよう。このフレーズを使おう。

 

【例】

・Numerous attempts have been made to

・high-throughout sequencing

 

【参考】

・Native英語の文例・例文を参考に英語論文を作成するサイト:☆☆☆

http://www.geocities.jp/kusumotokeiji/eigo5.htm

・松尾ぐみの論文の書き方:英語論文

http://ymatsuo.com/japanese/ronbun_eng.html

 

[比較調査]

*springer

can be expected to occur at :31

can be expected to occur at least :3

We have established a method for:23

We have established a method :58

is a major determinant of :3079

is a important determinant of :5536

is a prime determinant of :45

is a primary determinant of :353

is a dominant determinant of :18

is a cardinal determinant of :2

is a magistral determinant of :0

is a paramount determinant of :3

is a premier determinant of :0

is a principal determinant of :40

→国別、分野別で比較できる

is a major determinant of the distribution of :5

is the only current method to diagnose :1

 

*inMexes

can be expected to occur at :0

can be expected to occur :候補フレーズ2(しかしLSDでは検出されず)

can be expected to :ある程度検出される

 

*比較

year

subject

country

*therefore,

springerは5~6字以上での使用を勧める(特に6字以上)

 

 

【筋書き】

→文献中の英語表現を軽快に検索するサービスinMeXesがある。

→inMeXesで検索:Numerous attempts have been made to(フレーズ出現回数50)

→使用頻度を調べたい。(inMeXesでは面倒。)そうだ。Springer Exemplarを使ってみよう!

→スプリンガーの説明

→Springer Exemplar検索:Numerous attempts have been made to(328)

→最近の使用率、分野、国別、publication、pblication type、、、、

→結果:最近の使用頻度は悪くない。USAでもメジャーで使われているらしい。分野もマッチしてるしOK。論文でも使用頻度が高い。

→左側はファセット検索になっている。筆頭著者がアメリカ人か調べたいときは、USAに指定。

→論文にカーソルを合わせるだけで、ジャーナルの表紙・タイトル・著者も確認。

(→論文がよみたくなったら、Open Accessに指定)*入れるか検討*

→ジャーナルへ飛ぶ。

→(注意)springer検索「be expected(to be)(as) 」 などの短い単語やフレーズは検索に時間がかかる。(この場合はinMeXesをおすすめする。)5・6字以上のフレーズ検索がお勧め。

Springer:専門分野の論文を執筆の際に、使用率を考慮してクオリティーの高い英語表現を使用するときにぜひご活用ください。

→Springerぜひご活用ください。

 

検討中

・・splingerの説明:最初?またはinMeXesの後?

・・ファセット検索の説明

130607 Springer Exemplar;筋書き

以下筋書きです。撮影に入りはじめました。

【筋書き】

→導入
・Springer exemplarは電子ジャーナル出版社シュプリンガー(Springer)社が運営する、無料の英語論文の著者向けサーピスです。
ある単語が、学術文献の中でどのように使用されているのかシュプリンガーの1900誌のジャーナルの中から見つけ出すことができます
分野はライフサイエンス、医学、工学、数学コンピューターサイエンスだけでなく、ビジネス、法学も検索対象です。また対象論文は全て査読済みです。

 

<1部:term>

→検索(どんな文脈でつかわれているのかな?)
・iPS
→見方
・用例が一覧で表示
→左項目、ファセットの説明☆
・出版年(年別に用語がどのくらい使用されていいるかがわかる。流行がわかる。)
・研究分野・対象
・国(国別の用語使用論文数も比較可能)
・ジャーナル(出版物)
・出版物タイプ
・出版社
・Open Access articles only/All Articles

→ファセット選択
subject:life sciences
country: US
Open Access articles onlyを選択

→用例にカーソルをあわせる
・ジャーナル名と表紙、論文のタイトル、著者が表示される
→用例をクリック
・論文表示

※追加
<2部:phrase>
→検索:be expected to be (as?)
※be associated, associatedはerror(???). associateは可能。
→Chemistry
→Open access をクリック
→論文
→com+F「検索phrase」
・分野での使われ方がわかる。使用されたフレーズの論文にとべるので、com+Fで「were reccognized(表示されていた語句) 」で検索し、前後の文も読むことができる。

→終わり
・ぜひご活用ください。

*注意点

遅い。とくに熟語になるとものすごく遅い。

ソートの順番分からない。(新しい順でもない)


※比較
・LSDB
1語・2語前後でソート
集計値
・inMeXes
候補検索
ある単語の前後にどういう語がくることが多いかわかる。
検索結果のリンク先(LSD英辞郎、ウィキなど)にすぐに飛べる。

☆一押しポイント
・単語使用の論文数の国別・出版別比較
・前後の文脈がどのように使用されているかがわかる

 

※参考

英語論文執筆メモ

http://apollon.issp.u-tokyo.ac.jp/~watanabe/tips/proof.html

論文のよくある間違い 英語英文添削センター

http://www.speedtensaku.com/category/1502733.html

130524 springerexemplar

調査・筋書き作成中です。
【筋書き】

→導入

・Splinger exemplarは電子ジャーナル出版社シュプリンガー(Splinger)社が運営する、無料の英語論文の著者向けサーピスです。

ある単語が、学術文献の中でどのように使用されているのかシュプリンガーの1900誌のジャーナルの中から見つけ出すことができます

分野はライフサイエンス、医学、工学、数学コンピューターサイエンスだけでなく、ビジネス、法学も検索対象です。また対象論文は全て査読済みです。

 

→検索(どんな文脈でつかわれているのかな?)

・p53,iPS,Muscular dystrophy, embryo・・

→見方

・用例が一覧で表示

→左項目、ファセットの説明☆

・出版年(年別に用語がどのくらい使用されていいるかがわかる。流行がわかる。)

・研究分野・対象

・国(国別の用語使用論文数も比較可能)

・ジャーナル(出版物)

・出版物タイプ

・出版社

・Open Access articles only/All Articles

 

→ファセット選択

subject:life sciences

country: US

Open Access articles onlyを選択

 

→用例にカーソルをあわせる

・ジャーナル名と表紙、論文のタイトル、著者が表示される

→用例をクリック

・論文表示

→終わり

・ぜひご活用ください。

 

☆一押しポイント

・単語使用の論文数の国別・出版別比較

・前後の文脈がどのように使用されているかがわかる