研究成果報告書

研究課題名:「信頼性の高いタンパク質間相互作用データの抽出と解析」
バイオインフォマティクスプログラム(BI) 修士2年
学籍番号80332223 中村 征良

2004年

秋学期活動報告書:Refinement of E.coli PPI Network Using Bayesian Approach

修士論文:Genome-Wide Prediction and Refinement of E.coli PPI Data Using Bayesian Approach


要旨

先学期までの研究において、我々は大腸菌におけるゲノムワイドなPPI実験データからから信頼性の高いものを抽出してきた。今期は、そのようにして得られたデータセットの有用性および、そこから得られる知見を考察した。

 

データセットの有用性

最終的に、精製したPPIデータ(427個)を既知データと統合させることで、1,277個のタンパク質からなる3,667個の信頼性の高いPPIデータセットを構築することができた。このデータセットにおける各タンパク質の有する相互作用数の平均は6個である。下の図は、相互作用相手タンパク質数と、相互作用相手をその数所有しているタンパク質数の分布であり、このような傾向はその他多くの相互作用ネットワークにおいて観察されている。

 

Figure4-2

1:相互作用相手タンパク質の数(横軸)と、相互作用相手をその数所有しているタンパク質の数(縦軸)の相関

 

 

<0.002)であるのに対し、5個以上の場合は20.6%となっている。これらの傾向は、酵母においても観察されている。このように、我々が構築したPPIデータの傾向は、他に報告されているものと一致しており、実際の細胞内PPIを反映した結果であると考えられる。 >

それに加え、構築したPPIデータセットでは、相互作用相手の数と、その数を相互作用相手として保有しているタンパク質におけるessential proteinの割合の間には正の相関があることがわかった。たとえば、5個以下の相互作用相手を保有しているタンパク質のうち、それがessential proteinである割合は11.6%(P

 

考察

構築したPPIデータセットは、生物学的な考察をするのに妥当な信頼性と量を兼ね備えたデータセットであるといえる。それを示唆する事実として、このデータセットの中に、今回使用したPositive PPIsには含まれていない既知データ(例:FlgN-FlgL[43])を新たに文献により見つけることができた。

機能未知タンパク質の機能予測

現在、大腸菌における多くのタンパク質の機能が未知のままとなっている。しかしながら、PPIネットワークを用いることで、これらの機能未知タンパク質の機能を予測することが可能となる。相互作用をしているタンパク質は、互いに同じ機能を共有している傾向が強い。信頼性の高いPPIネットワークにおいてこの手法を用いることで、機能未知タンパク質の機能を予測することができる。我々は、大腸菌におけるタンパク質の機能情報をGenoBaseから取得し、構築した大腸菌PPIネットワークを用いて機能予測を行った。構築したPPIネットワークには、98個の機能未知タンパク質が含まれており、そのうち45個の機能未知タンパク質が、1個もしくはそれ以上の機能が分かっているタンパク質と相互作用していた。特に、そのうち9個の機能未知タンパク質に関しては、相互作用相手が全て共通の機能を有しており、機能予測の信頼性が他の機能未知タンパク質と比べて非常に高いといえる。表5が、9個の機能未知タンパク質の機能予測結果である。

表:構築した大腸菌PPIネットワークを用いた機能未知タンパク質の機能予測結果

遺伝子

機能予測結果(括弧の中は相互作用相手の数)

frvA

Transport/binding protein (3)

Tas

Cellular process (7)

yadI

Transport/binding protein (5)

yajC

Cellular process (7)

ybeV

Cellular process (3)

yhjK

Energy metabolism (3)

yidC

Cellular process (10)

yjcC

Energy metabolism (3)

yliB

Transport/binding protein (3)

 

 

新規PPIデータの考察

全ての生体細胞内には、複数の機能を有したタンパク質が多く存在する。我々の構築したPPIネットワークにおいては、複合体に含まれる複数のタンパク質が、互いに異なった機能を有しているケースが存在した。我々は、そのような相互作用とお互いの機能情報をもとに、タンパク質が有している更なる新規の機能を考察した。

NusAタンパク質

転写に関わるタンパク質と複製に関わるタンパク質がNusAを仲介して複合体を形成しているものが観察された(図2-A)。NusAは、別の因子であるNusB,NusG,Rhoと複合体を形成してRNA polymeraseに直接結合し、転写の終結を調節するタンパク質である。そのNusAは、我々が構築したPPIデータに含まれているPositive Dataにおいて転写因子複合体のサブユニットであるRpoB-RpoCと相互作用を有していることがわかっている。一方で、我々が実験データから精製したPPIデータにおいて、DNAポリメラーゼであるDnaEが、DNAヘリカーゼであるDnaBと、さらにNusAとも相互作用していることが判明した。DnaBとDnaEはDNA複製因子複合体に含まれるタンパク質である。そのことからNusAは転写においてもDNA複製においても抗終結因子としても働いている可能性が示唆される。

IscSタンパク質

 染色体分離機構と細胞骨格に関わる2つのタンパク質複合体が、硫黄代謝のタンパク質複合体と相互作用している可能性が示唆された(図2-B)。MukBとIscS間の相互作用は、我々の精製したPPIデータに含まれているが、我々が使用したPositive Dataには含まれていない。いわゆる実験PPIデータから精製されたデータである。しかし、この相互作用を新規に文献において見つけることができた。  MreBとIscS間の相互作用は実験PPIデータから精製されて得られた相互作用である。MukBは染色体の構造維持(SMC: Structural Maintenance of Chromosomes)タンパク質の1つであり、細胞分裂における染色体分離にとって不可欠なタンパク質である。MreBは細胞の中心軸に沿って伸びたらせん状の繊維を形成しているタンパク質であり、原核細胞におけるアクチンと構造的にも機能的にも相同性があり、細胞骨格の1つの要素であると考えられている。また、細胞の形作りや染色体の分離を調整する役割を担っていることが知られている。IscSは、もともとtRNAチオウリジン合成酵素であるシステインデスルフラーゼとして知られており、IscSとIscUは鉄-硫黄クラスターを形成するタンパク質複合体である。そして、IscAもまた、鉄-硫黄クラスターに属していると考えられている。iscSUAは、バクテリアにおいて広く保存されている遺伝子クラスターである。最近においてIscAは、細胞分裂のための収縮リングを形成するFtsZや、分裂部位の決定を行うMinCDEとは別に、極細胞もしくはその周辺の細胞分裂部位に位置していることが報告されている。しかしながら、IscAとMreBの関係はこの報告には触れられていない。そのことから、MukBとIscS、MreB間の相互作用は染色体分離因子の候補となると考えられ、さらにIscSには細胞分裂の際の染色体分離に関係する未知の機能を有していることが示唆された。

 

Figure5-A

Figure5-B

図5:(A)NusA周辺におけるPPIネットワーク

(B)IscS周辺におけるPPIネットワーク

References

[1] Ito T, Chiba T, Ozawa R, Yoshida M, Hattori M, Sakaki Y. "A comprehensive two-hybrid analysis to explore the yeast protein interactome." Proc Natl Acad Sci U S A. 2001 Apr 10;98(8):4569-74. Epub 2001 Mar 13.
[2] Uetz P, Giot L; Cagney G et al. "A comprehensive analysis of protein-protein interactions in Saccharomyces cerevisiae" Department of Genetics, University of Washington, Seattle 98195-7360, USA
[3] Xenarios I, Salwinski L, Duan XJ, Higney P, Kim SM, Eisenberg D. "DIP, the Database of Interacting Proteins: a research tool for studying cellular networks of protein interactions." Nucleic Acids Res. 2002 Jan 1;30(1):303-5.
[4] Kumar A, Snyder M. "Protein complexes take the bait." Nature. 2002 Jan 10;415(6868):123-4. No abstract available.
[5] Finley R, L Jr, Brent R "Interaction mating reveals binary and ternary connections between Drosophila cell cycle regulators" Proc Natl Acad Sci U S A. 1994 Dec 20;91(26):12980-4.
[6] Mrowka R, Patzak A, Herzel H "Is there a bias in proteome research?" Genome Res. 2001 Dec;11(12):1971-3.
[7] Karp PD, Riley M, Saier M, Paulsen IT, Collado-Vides J, Paley SM, Pellegrini-Toole A, Bonavides C, Gama-Castro S. "The EcoCyc Database" Nucleic Acids Res. 2002 Jan 1;30(1):56-8.
[8] Pellegrini M, Marcotte EM, Thompson MJ, Eisenberg D, Yeates TO. "Assigning protein functions by comparative genome analysis: protein phylogenetic profiles."Proc Natl Acad Sci U S A. 1999 Apr 13;96(8):4285-8.
[9] Grigoriev A. "relationship between gene expression and protein interactions on the proteome scale: analysis of the bacteriophage T7 and the yeast Saccharomyces cerevisiae." Nucleic Acids Res. 2001 Sep 1;29(17):3513-9.
[10] Saito R, Suzuki H, Hayashizaki Y. "Global insights into protein complexes through integrated analysis of the reliable interactome and knockout lethality." Biochem Biophys Res Commun. 2003 Feb 14;301(3):633-40.
[11] Jeong H, Mason SP, Barabasi AL, Oltvai ZN. "Lethality and centrality in protein networks." Nature. 2001 May 3;411(6833):41-2.
[12] Walhout, A.J. et al.(2000) "Protein interaction mapping in C. elegans using proteins involved in vulval development." Science 287:116-122
[13] Schwikowsk B, Uetz P, Fields S. "A network of protein-protein interaction-in yeast." Nat Biotechnol. 2000 Dec; 18(12);1257-61
[14] Nakai K, Horton P. "PSORT: a program for detecting sorting signals in proteins and predicting their subcellular localization." Trends Biochem Sci. 1999 Jan;24(1):34-6.
[15] Oshima T, Wada C, Kawagoe Y, Ara T, Maeda M, Masuda Y, Hiraga S, Mori H. "Genome-wide analysis of deoxyadenosine methyltransferase-mediated control of gene expression in Escherichia coli." Mol Microbiol. 2002 Aug;45(3):673-95.


今期の学会発表

 
・「大腸菌タンパク質間相互作用ネットワークのマイニング」
斎藤輪太郎 中村征良 続木恒平 木村曜 荒武 伊藤文 Md.Arifuzzaman 前田真希 大島拓 和田千恵子 森浩禎 冨田勝
★微生物ゲノム研究のフロンティア, 2004
Frontier of Microbial Genome Research, P13, 2004
 
・「ゲノムワイドデータの統合による信頼性の高いPPIネットワークの構築」
中村征良 木村曜 斎藤輪太郎 荒武 伊藤文 Md.Arifuzzaman 前田真希 大島拓 和田千恵子 森浩禎 冨田勝
◎微生物ゲノム研究のフロンティア, 2004
Frontier of Microbial Genome Research, P54, 2004
 
・「大腸菌タンパク質間相互作用ネットワークのマイニング」
続木恒平 中村征良 斎藤輪太郎 木村曜 武田朋子 久間大輔 小林雄輔 藤森茂雄 荒武 伊藤文 Md.Arifuzzaman 前田真希 大島拓 和田千恵子 森浩禎 冨田勝
◎微生物ゲノム研究のフロンティア, 2004
Frontier of Microbial Genome Research, P57, 2004
 
"Construction of Reliable Protein-Protein Interaction Network in Escherichia coli"
Rintaro Saito, Seira Nakamura, Hikaru Kimura, Kohei Tsuzuki, Takeshi Ara, Aya Ito, Md. Arifuzzaman, Maki Maeda, Masanari Kitagawa, Aki Hirai, Chieko Wada, Taku Oshima, Hirotada Mori1, Masaru Tomita
2nd International E.Coli Alliance Conference on Systems Biology Information
2nd International E.Coli Alliance Conference on Systems Biology - Project Gemini
 
・「再現性の高い大腸菌タンパク質間相互作用ネットワークの構築と機能未知タンパク質の機能予測」
斎藤輪太郎 中村征良 荒武 伊藤文 Md.Arifuzzaman 前田真希 北川正成 平井晶 和田千恵子 大島拓 森浩禎 冨田勝
◎第27回日本分子生物学会年会2004
○第27回日本分子生物学会年会プログラム・講演要旨集P.789
 
・「ゲノムワイドデータの統合による信頼性の高いPPIネットワークの構築」
中村征良 木村曜 続木恒平 斎藤輪太郎 荒武 伊藤文 Md.Arifuzzaman 前田真希 北川正成 平井晶 大島拓 和田千恵子 森浩禎 冨田勝
◎第27回日本分子生物学会年会2004
○第27回日本分子生物学会年会プログラム・講演要旨集P.789 
 
・「選択的スプライシングによるタンパク質間相互作用制御のコンピュータ解析」
加来聡子 中村征良 斎藤輪太郎 冨田勝
◎第27回日本分子生物学会年会2004
○第27回日本分子生物学会年会プログラム・講演要旨 P.789
 
 
★:口頭発表 ◎:学会発表 ○:学会内出版 ●:学内論文集

  
 

過去の研究成果

 
・「遺伝子領域内ストランドバイアスの解析」
中村征良 荒川和晴
●生命と情報, 2001, (8)77-86, 湘南藤沢学会, (ISBN 4-87762-098-2)
 
 "Statistical Correlation of Synonymous Codon Bias and Phylogenetic Tree"
Seira Nakamura, Kazuharu Arakawa, Masaru Tomita
IAB&JBA&DOE (supprted NEDO) US-JAPAN Joint Workshop on Systems Biology 
of Useful Microorganisms, 2002
US-JAPAN Joint Workshop on Systems Biology of Useful Microorganisms,P.16, 2002
 
"Development of Comparative Genome Analysis System (COMGA) on the G-language Genome Analysis Environment"
Seira Nakamura, Tatekimi Matsuzaki, Kazuharu Arakawa, Koya Mori,
Yoichi Nakayama, Masaru Tomita
Genome Informatics Workshop, 2002
Genome Informatics 13: 531-532 (2002), Universal Academy Press Inc, Tokyo (ISBN 4-946443-79-7)
 
・「同義コドンバイアスを用いた原核生物間の進化的距離の予測」
中村征良 荒川和晴 冨田勝
◎第25回日本分子生物学会年会2002
○第25回日本分子生物学会年会プログラム・講演要旨集P.447
 
・「同義コドンバイアスを用いた進化的距離の予測」
中村征良 荒川和晴
●生命と情報, 2002, (9)165-173, 湘南藤沢学会, (ISBN 4-87762-114-8)
 
"Development of Systems upon G-language GAE"
松崎建君 中村征良 久間大輔 荒川和晴
●生命と情報, 2002, (9)65-86, 湘南藤沢学会, (ISBN 4-87762-114-8)
 
"Development of Comparative Genome Analysis System (COMGA) on the G-language Genome Analysis Environment"
Seira Nakamura, Tatekimi Matsuzaki, Kazuharu Arakawa, Koya Mori, 
Yochi Nakayama, Masaru Tomita
◎微生物ゲノム研究のフロンティア, 2003
Frontier of Microbial Genome Research, P17, 2003
 
"Development of method to predict protein function of Escherichia coli using protein complex data."
Seira Nakamura, Rintaro Saito, Takeshi Ara, Aya Itoh, MD Arifuzzaman, Maki Maeda, 
Taku Oshima, Shigehiko Kanaya, Chieko Wada, Hirotada Mori, Masaru Tomita
First International E.coli Alliance Conference on Systems Biology of E.coli, 2003
 
"Genome-wide analysis of protein-protein interactions in Escherichia coli"
  Md. Arifuzzaman, Maki Maeda, Takita Chiharu, Taku Oshima, Aya Itoh, Shigehiko Kanaya, Altaf-Ul-Amin, Hikaru Kimura, Seira Nakamura, Rintato Saito, Masaru Tomita, 
Chieko wada, Hirotada Mori
First International E.coli Alliance Conference on Systems Biology of E.coli, 2003
 
"Prediction of Interacting Motif from Protein-Protein Interaction Data of Escherichia coli."
Hikaru Kimura, Seira Nakamura, Rintaro Saito, Takeshi Ara, Aya Itoh, Md. Arifuzzaman, 
Maki Maeda, Taku Oshima, Shigehiko Kanaya, Chieko Wada, Hirotada Mori, Masaru Tomita
First International E.coli Alliance Conference on Systems Biology of E.coli, 2003
 
・「大腸菌タンパク質間相互作用データの精製とタンパク質の機能予測」
"Development of Method to Predict Protein Function of Escherichia coli Using Protein Complex Data"  
中村征良 斎藤輪太郎 荒武 伊藤文 Md.Arifuzzaman 前田真希 大島拓 和田千恵子 森浩禎 冨田勝
◎情報計算化学生物学会 Chem-Bio Informatics Society 2003年大会  
New Frontiers for Chem-Bio Informatics, P238, 2003  
 
 
"Prediction of Motif-Motif Interaction and Protein-Protein Interaction in Escherichia coli."  
Hikaru Kimura, Seira Nakamura, Rintaro Saito, Takeshi Ara, Aya Itoh, Md. Arifuzzaman, Maki Maeda, Taku Oshima, Chieko Wada, Hirotada Mori, Masaru Tomita  
◎情報計算化学生物学会 Chem-Bio Informatics Society 2003年大会  
New Frontiers for Chem-Bio Informatics, P239, 2003  
 
"Development of Method to Predict Protein Function of Escherichia coli Using Protein Complex Data."  
Seira Nakamura, Rintaro Saito, Takeshi Ara, Aya Itoh, Md. Arifuzzaman, Maki Maeda, Taku Oshima, Chieko Wada, Hirotada Mori, Masaru Tomita  
International Workshop for Escherichia coli Towards New Biology in the 21st Century  
Systematic functional analysis for Escherichia coli genome - resorces, systems approach and towards modeling -, P.91, 2003  
 
"Prediction of Motif-Motif Interaction and Protein-Protein Interaction in Escherichia coli."  
Hikaru Kimura, Seira Nakamura, Rintaro Saito, Takeshi Ara, Aya Itoh, Md. Arifuzzaman, Maki Maeda, Taku Oshima, Chieko Wada, Hirotada Mori, Masaru Tomita  
International Workshop for Escherichia coli Towards New Biology in the 21st Century  
Systematic functional analysis for Escherichia coli genome - resorces, systems approach and towards modeling -, P.96, 2003  
 
"Refinement and Mining of Protein-Protein Interaction Network in Escherichia coli."  
Rintaro Saito, Seira Nakamura, Hikaru Kimura, Kohei Tsuzuki, Tomoko Takeda, Daisuke Kyuma, Yusuke Kobayashi, Shigeo Fujimori, Takeshi Ara, Aya Itoh, Md. Arifuzzaman, Maki Maeda, Taku Oshima, Chieko Wada, Hirotada Mori, Masaru Tomita  
International Workshop for Escherichia coli Towards New Biology in the 21st Century  
Systematic functional analysis for Escherichia coli genome - resorces, systems approach and towards modeling -, P.64, 2003  
 
・「大腸菌タンパク質間相互作用データの精製とタンパク質の機能予測」  
中村征良 斎藤輪太郎 荒武 伊藤文 Md.Arifuzzaman 前田真希 大島拓 和田千恵子 森博禎 冨田勝  
◎第26回日本分子生物学会年会2003  
○第26回日本分子生物学会年会プログラム・講演要旨集P.685  
 
・「大腸菌におけるモチーフ間相互作用とタンパク質間相互作用の予測」  
木村曜 中村征良 斎藤輪太郎 荒武 伊藤文 Md.Arifuzzaman 前田真希 大島拓 和田千恵子 森博禎 冨田勝  
◎第26回日本分子生物学会年会2003  
○第26回日本分子生物学会年会プログラム・講演要旨集P.686
 
 
★:口頭発表 ◎:学会発表 ○:学会内出版 ●:学内論文集

戻る