まずは、様々なパスウェイデータベースの一覧を見てみましょう。
500 以上のデータベースが下記の分類でリストアップされています。
- タンパク質間相互作用 (PPI)
- 代謝パスウェイ
- シグナリングパスウェイ
- パスウェイダイアグラム
- 転写因子・遺伝子制御ネットワーク
- タンパク質-化合物間相互作用
- 遺伝的相互作用ネットワーク
- アミノ酸配列解析
- その他
ここで、Standard の欄がデータ形式のどの標準化 (PSI-MI, BioPAX, SBMLなど) に準拠しているかを示しています (PSI-MI はパスウェイというよりタンパク質間相互作用の記述フォーマット)。
BioCyc のウェブサイトを開いてみてください。
Tair1, 2, 3 のパスウェイリストを確認し、
好きな生物種のパスウェイを見てみましょう。例えば Homo sapiens を選んで HumanCyc に移動し、
上部のメニュー Metabolism から Cellular Overview を選択するとヒトの代謝パスウェイの全体像が表示されます。
Reactome のウェブサイトを開いてみてください。
Analyze Data をクリックし、サンプルデータを用いてどのように可視化されるか見てみます。
Analysis Tools の Click data file to paste your data or try example data sets を開いて、 Uniprot accession list や Gene name list など適当なものを選んで Analyse をクリックすると、 パスウェイ全体像のうち、指定した遺伝子に該当する部分がマークアップされたパスウェイが表示されます。
KEGG のウェブサイトを開いてください。
参考資料
今回は AJACS54 の資料 (とくに 23 ページ以降の後半) を使って実習します。
実習3 KEGG Mapper を用いたパスウェイ再構築
例題: ある研究チームは、⼤腸菌K-12株の遺伝⼦「dapA」⾼発現下で細胞のL-リジン⽣産量が上がることを発⾒した。 この結果を説明する代謝経路を KEGG mapper を⽤いて検索せよ。
KEGG のウェブサイトを開く
KEGG Organisms を開くと、KEGG では大腸菌 Escherichia coli K-12 MG1655 を eco というコードで表していることが分かる。
eco の文字をクリックして、
検索窓で遺伝子名 dapA を検索すると、大腸菌 eco では dapA 遺伝子の ID が b2478 であることが分かる。
ここで Pathway から Lysine biosynthesis の eco00300 をクリックするだけで該当するパスウェイの図が表示されるが、 課題は KEGG Mapper を用いてということだったので、KEGG のページに戻り、
KEGG PATHWAY を選択し、
Pathway Mapping のところから Search&Color Pathway をクリック
Search against に書かれている ko を eco に書き換え、Enter objects one per line に b2478 を記入して Exec をクリック。 結果一覧から eco00300 Lysine biosynthesis を選ぶと先ほどと同じパスウェイが表示されることが分かる。KEGG Mapper では、複数の遺伝子や化合物を含むパスウェイを検索できることと、該当する遺伝子や化合物に自由に色を指定することができるのが利点です。
なお、パスウェイの図から検索結果の 4.3.3.7 をクリックすると、大腸菌でこの酵素番号を持っているすべての遺伝子が表示されてしまいます。これらはパスウェイ的には区別されていないことになります。
実習4 BlastKOALA をつかった自動アノテーション
Pathway Mapping のページに戻り、
左のパネルから Annotate Sequence をクリック
資料の通り、サンプルの FASTA 配列を Buchnera に対して検索すると、ざっくりとしたエンリッチメント解析結果とパスウェイへのマッピング結果を見ることができる。 資料と比べて Unclassified が減っていました。
メタゲノムや新規ゲノムの予測遺伝子配列セットから、より正確なパスウェイ再構築を行いたい場合は KAAS を使うことができます。
- ヒトの遺伝子一覧
% curl http://rest.kegg.jp/list/hsa > list_hsa.txt
% wc -l list_hsa.txt
39726
- ヒトのパスウェイ一覧
% curl http://rest.kegg.jp/list/pathway/hsa > list_pathway_hsa.txt
% wc -l list_pathway_hsa.txt
296
- ヒトの遺伝子一覧とパスウェイの対応
% curl http://rest.kegg.jp/link/hsa/pathway > link_hsa_pathway.txt
% wc -l link_hsa_pathway.txt
24782
% cut -f 2 link_hsa_pathway.txt | sort | uniq | wc -l
6896
% echo '100 * 6896 / 39726' | bc -l
17.3589
KEGG のヒト遺伝子 39726 個のうち、ヒトの KEGG パスウェイ 296 種に載っている遺伝子はのべ 24782 個。ここから同じ遺伝子の重複を省くと 6896 個。もとの遺伝子数のうち 17.4% しかパスウェイに記載されていないことが分かる。
- 多くのパスウェイに登場する遺伝子
% cut -f 2 link_hsa_pathway.txt | sort | uniq -c | sort -rn | head
83 hsa:5594 MAPK1 mitogen-activated protein kinase 1 (EC:2.7.11.24)
82 hsa:5595 MAPK3 mitogen-activated protein kinase 3 (EC:2.7.11.24)
72 hsa:5290 PIK3CA phosphatidylinositol-4,5-bisphosphate 3-kinase, catalytic subunit alpha (EC:2.7.11.1 2.7.1.153)
71 hsa:5296 PIK3R2 phosphoinositide-3-kinase, regulatory subunit 2 (beta)
71 hsa:5294 PIK3CG phosphatidylinositol-4,5-bisphosphate 3-kinase, catalytic subunit gamma (EC:2.7.11.1 2.7.1.153)
71 hsa:5293 PIK3CD phosphatidylinositol-4,5-bisphosphate 3-kinase, catalytic subunit delta (EC:2.7.1.153)
71 hsa:5291 PIK3CB phosphatidylinositol-4,5-bisphosphate 3-kinase, catalytic subunit beta (EC:2.7.1.153)
70 hsa:8503 PIK3R3 phosphoinositide-3-kinase, regulatory subunit 3 (gamma)
70 hsa:5295 PIK3R1 phosphoinositide-3-kinase, regulatory subunit 1 (alpha)
70 hsa:23533 PIK3R5 phosphoinositide-3-kinase, regulatory subunit 5
- 一度しか登場しない遺伝子
% cut -f 2 link_hsa_pathway.txt | sort | uniq -c | sort -rn | tail
1 hsa:10021
1 hsa:1002
1 hsa:10019
1 hsa:10015
1 hsa:100133941
1 hsa:100132074
1 hsa:100101267
1 hsa:10010
1 hsa:1001
1 hsa:10008
これらに bfind で遺伝子アノテーションを見てみましょう。
のトップページにある検索窓から遺伝子 ID を入力、もしくは左のパネルから Searching KEGG をクリックし、DBGET Search から genes をクリックして、遺伝子 ID を検索できます。
- Pathway Commons http://www.pathwaycommons.org/
サンプルのクエリを用いてパスウェイがどのように表示されるか見てみましょう。
様々なウェブアプリ、商用アプリ、R の BioConductor パッケージ等が利用可能です。 目的に応じて論文 PLoS Comput Biol 2012, 8:e1002375 などを参照してご利用ください。
シミュレーションに用いることのできるパスウェイ表現としては、システムバイオロジーで用いられる SBML が利用可能です。 Cell Designer を用いるとパスウェイを描画し SBML を作成することができます。 システムバイオロジーのサイトには SBML を利用したシミュレーションのソフトウェアが紹介されています。
- SBML
- Cell Designer
Cell Designer で構築されたパスウェイは BioModels に多数収録されているほか、アルツハイマー病のパスウェイを SBML で記述した AlzPathway など様々なパスウェイが構築されています。
- BioModels
- AlzPathway