森基金 研究成果報告書

環状バクテリアゲノムにおける複製終結点の予測

慶應義塾大学
政策・メディア研究科 修士課程1年 河野暢明


要旨

バイオテクノロジーの発展に伴い大量のバクテリアゲノムの配列が解読されている現 在, 複製の仕組みとゲノム構造の理解もまた進んできている.本研究では環状バクテリ アゲノムにおける複製に関連したゲノム構造を網羅的に解析し,複製によって特徴的な 分布,位置,方向性,塩基組成を持つオリゴ配列,遺伝子,DNA 領域を明らかにする. また,既存の特徴的な要素とともにこれらの要素の複製による選択圧を,相対的かつ定 量的に解析する.今回はProteobacteriaを対象としたdif配列をin silicoによって予測し た.


第1章 背景

環状染色体を持つバクテリアにおいては,一つの決まった領域から複製が始まる.Escherichia coliを例にとれば,まず約245bpの複製開始領域に多く存在するDnaA-boxと呼ばれる9塩基の配列 (5’-TTATMCAMA-3’) (Schaper, et al., 1995)にDnaAタンパクが結合し,近接のATリッチな領域の 二本鎖DNAをほどく.ほどかれた一本鎖DNAにDnaBヘリカーゼやDnaGプライマーゼ,さらに Pol IIIなどといった多くのタンパク質が結合し,複製フォークが形成される (Schaeffer, et al., 2005).複製フォークは複製開始点を起点として両方向に,つまり対称のDNA二本鎖をほどきな がら複製を進めていく.ゲノム中には複製方向を向き,逆方向から来る複製フォークの進行を 妨げるTusタンパクが結合する共通配列Terがいくつか存在するが (Neylon, et al., 2005),これら Tusタンパクの働きと共に,複製は開始点とはほぼ正反対の領域で,進行してきた複製フォーク の衝突によって起こると考えられてきた.複製フォークはゲノム上に欠損がある場合などに進 行が阻害される場合があるが,このような場合には二重鎖切断が起こることがあり,相同組換 えによる修復が起こる.この組換えが奇数回起こると最終的にDNAが二つに分割されず,一つ の巨大な二量体DNAが形成されてしまいその生物の増殖効率は著しく低下する.そこで二量体 DNAを二つの一量体娘DNAへと切り離すため,FtsK-Orienting Polar Sequences (KOPS) と呼ばれ る強い方向性を持つ8塩基配列 (5’-GGGNAGGG-3’) によって複製終結点に導かれたFtsKタンパ クと共に,XerC/Dが28bpのdif領域を利用して相同組換えを行う (Bigot, et al., 2007; Strick, et al., 2006; Yates, et al., 2006).

このような配列やゲノム構造は,多少のゆらぎがありながらも多くの種で保存されている傾 向があるが (Hendrickson, et al., 2007; Higgins, 2007),複製開始・ 終結点を同定する実験は非常に コストがかかるため,現在ほぼ全てのバクテリアゲノムプロジェクトではコンピュータによる 予測値を利用している (Worning, et al., 2006).代表的な予測ソフトウェアとしてOriloc (Frank, et al., 2000) があげられ,これはDNA Walk (Lobry, 1996) と呼ばれる解析をもとに複製開始点を 予測するソフトウェアで,現在de factoスタンダードとなっている.しかしながら,これらの手 法による複製終結点の予測精度は低い.DNA WalkのGC比における投射であるGC Skewはリーデ ィング鎖とラギング鎖におけるGとCの塩基組成の偏りの事であり (C+G)/(C-G) という式で表 される (Lobry, 1996).強弱の差こそあるもののほとんどのバクテリアゲノムにおいて観察され, そのシフトポイントを用いて複製開始・終結点を予測する事ができる.複製進行中,リーディ ング鎖とラギング鎖では複製機構が違い,変異の起こる確率にも差が生じてくる.そのため, リーディング鎖にはGが,ラギング鎖にはCが偏って存在するようになる.この現象に対してGC Skewを用いる事により,複製の始まりと終わりの領域が塩基の偏りから予測できる.しかしな がら,GC Skewは全バクテリアゲノムにおいて顕著なシフトポイントのあるデータが得られる訳 ではない (Arakawa, et al., 2007).

このように,現在複製開始・終結点を塩基組成のみで汎用的に予測することは困難であるため, 本研究では複製終結点近辺のdif配列に着目した.そもそもこれまでバクテリアゲノムの複製が 終結する場所はTer配列であると考えられてきたが,染色体分配に不可欠なdif配列がE. coliで発見 され (Blakely, et al., 1996),複製の終結はdifによって決定されていると考えられるようになった (Hendrickson, et al., 2007; Higgins, 2007).そのため,E. coliと近縁の生物におけるdif配列の保存性 や位置を観察することでより精度の高い複製終結点の予測が可能になると考えられる.さらに, このようにして予測したdif配列と複製開始点との対称性を検証することで,増殖効率の変化に ついての関係性を語ることが出来る可能性がある.増殖効率の変化に影響を与える因子の解明 に関してはまず,先行研究でin vivoで逆位変異体の株の増殖効率を測定している実験データ (Kuroki, et al., 2008) を用いて,in silicoで増殖効率に影響を与えている因子の特定を目的とし た.現在バクテリアの増殖効率にはNDZ (Non-Divisible Zones) という逆位を入れることによって 増殖に著しく影響を与える領域が解明されてきている (Campo, et al., 2004).NDZには複製開 始点や終結点が含まれる傾向にあるが,この定義からそもそも対象としている生物の複製開始 点・終結点らが正確に解明されている必要がある.本研究で複製開始・終結点の対称性以外に も塩基組成など他の要因を見つけ出すことが出来れば,合成生物学において,より増殖効率の 高い生物の生産につながる事になるだろう. そこで本研究ではE. coliのdif配列をテンプレートとしてdif配列を予測した結果を述べる.


第2章 手法と対象

Proteobacteria111種,Firmicutes118種,Actinobacteria20種のゲノム配列はNCBI RefSeqのデータを Proteobacteriaにおけるdif配列の予測に用いた.E. coilのdif配列は以下の通りである(5’- RGTGCGCATAATGTATATTATGTTAAAT -3’)(Blakely, et al., 1996).同様に,Firmicutesでは ACTKYSTAKAATRTATATTATGTWAACTを,ActinobacteriaではTTSRCCGATAATVNACATTATGTCAAGTを, それぞれ参考配列として曖昧探索を行った (Hendrickson, et al., 2007).

グループ内で7塩基までの変異を認めた曖昧探索(Fuzzy matching)を行い,曖昧探索の結果か らコンセンサス配列との類似度でスコアリイングを行った.曖昧探索によって予測されたdif配 列の候補を基にClustalWを用いてアライメントを行い,最尤推定法(ML法)で系統樹を描画し た.また,dif配列の系統樹と類似性の比較をするために,系統的プロファイリングで定石とな っている16S rRNA,dif配列を標的とするタンパク(XerC/D),そして,進化速度が早く,多種に 共通して存在するため16S rRNAより系統樹解析に適していると言われているgyrB (Yamamoto, et al., 1995) の4つの指標を用いた.


第3章 結果

Proteobacteria全種に対して行った曖昧検索の結果,ほぼすべての種で有意なdif配列が予測された. 表ではそれぞれの属に含まれる種が2種以上のデータの一部が示されている.予測されたdif 配列が複製開始点に対してどの位置に存在しているかの割合を計算(対称に存在している場合 は0%で,同じ場所の場合は100%となる)し,属毎の平均(M)とその標準偏差(±SD)のデー タがそれぞれ載せてある.これらの配列は検索の結果,それぞれの種で唯一発見されたトップ ヒットであり,28塩基という長さからも偶然性は低い.E. coliでは一種のみ一塩基変異が見られ たが,ほぼすべての種が同様のdif配列を保持していた.コンセンサス配列との類似度でスコア リングした結果から,同率1位のdif候補配列は他になかった. ただし,FirmicutesやActinobacteriaではあまり有意とは言い難い結果が見られたため,本論文 ではProteobacteriaの結果に関してのみ述べる.

表:予測された属毎のdif配列リストと複製開始点との対称性

第4章 考察と展望

第2章にて,E. coliのdif配列を元にして予測された配列は7塩基以内の変異でほぼすべての種で有 意に確認することがでた.さらに,これらの配列は種毎に強くモチーフが保存されていた.複 製開始点との対称性を見たところ,表の通りBordetella属で15%を示しているが,ほぼ対称の 位置にdifが存在していることが分かった.実際Bordetella属のB. parapertussis 12822(NC_002928) では複製開始点と終結点は対称の位置に存在していない事が予測されており,これまでの予測 手法の結果と遜色ない結果が得られていることが分かる.しかし,今回の予測手法では, グループ内でdif配列が実験的に証明されている種をテンプレートに検索を行っているため,汎 用的に環状ゲノムのバクテリア全種に対して同様の予測を行うことはできない.様々な指標の 系統的プロファイリングを行うことによって,それらの系統樹との定量的な比較検証を行う琴 によって,系統樹の分岐数や配列の変異数などをパラメータとして線形代数を用いて計算し, 定量的に系統樹の類似性を語る事ができるだろう.他の指標との共進化の正確性が検証できれ ば,FirmicutesやActinobacteriaでも系統的プロファイリングからdif配列を予測することが可能になる.

参考文献

Arakawa, K., et al. (2007) Noise-reduction filtering for accurate detection of replication termini in bacterial genomes, FEBS Lett, 581, 253-258.

Bigot, S., et al. (2007) FtsK, a literate chromosome segregation machine, Mol Microbiol, 64, 1434-1441.

Blakely, G. and Sherratt, D. (1996) Determinants of selectivity in Xer site-specific recombination, Genes Dev, 10, 762-773.

Campo, N., et al. (2004) Chromosomal constraints in Gram-positive bacteria revealed by artificial inversions, Mol Microbiol, 51, 511-522.

Frank, A.C. and Lobry, J.R. (2000) Oriloc: prediction of replication boundaries in unannotated bacterial chromosomes, Bioinformatics, 16, 560-561.

Hendrickson, H. and Lawrence, J.G. (2007) Mutational bias suggests that replication termination occurs near the dif site, not at Ter sites, Mol Microbiol, 64, 42-56.

Higgins, N.P. (2007) Mutational bias suggests that replication termination occurs near the dif site, not at Ter sites: what's the Dif?, Mol Microbiol, 64, 1-4.

Lobry, J.R. (1996) A simple vectorial representation of DNA sequences for the detection of replication origins in bacteria, Biochimie, 78, 323-326.

Lobry, J.R. (1996) Asymmetric substitution patterns in the two DNA strands of bacteria, Mol Biol Evol, 13, 660-665.

Neylon, C., et al. (2005) Replication termination in Escherichia coli: structure and antihelicase activity of the Tus-Ter complex, Microbiol Mol Biol Rev, 69, 501-526.

Schaeffer, P.M., et al. (2005) Protein--protein interactions in the eubacterial replisome, IUBMB Life, 57, 5-12.

Schaper, S. and Messer, W. (1995) Interaction of the initiator protein DnaA of Escherichia coli with its DNA target, J Biol Chem, 270, 17622-17626.

Strick, T.R. and Quessada-Vial, A. (2006) FtsK: a groovy helicase, Nat Struct Mol Biol, 13, 948-950.

Worning, P., et al. (2006) Origin of replication in circular prokaryotic chromosomes, Environ Microbiol, 8, 353-361.

Yamamoto, S. and Harayama, S. (1995) PCR Amplification and Direct Sequencing of gyrB Genes with Universal Primers and Their Application to the Detection and Taxonomic Analysis of Pseudomonas putida Strains, Appl Environ Microbiol, 61, 3768.





2008年度業績一覧

論文発表

・Arakawa K*, Tamaki S, Kono N, Kido N, Ikegami K, Ogawa R, Tomita M, “Genome Projector: zoomable genome map with multiple views”, BMC Bioinformatics, 2009, 10(1):31.



学会発表

・Kono N, Arakawa K, Tomita M. “Growth Efficiency of Bacteria Depends on the Genomic Polarity”, BMB, 2008, Kobe, Japan

・Kono N, Arakawa K, Kido N, Ogawa R, Oshita K, Ikegami K, Tamaki S, Tomita M, “Web-based Zoomable Pathway Browser using KEGG Atlas and Google Maps API”, GIW, 2008, Gold Coast, Australia

・Kono N, Arakawa K, Tomita M. “Growth Efficiency of Bacteria Depends on the Genomic Polarity”, 3R Symposium, 2008, Shizuoka, Japan



受賞

・GIW 2008 Student Bursary

・Mashup Award 4