遺伝子の翻訳終結部位周辺における網羅的コンピュータ解析

政策・メディア研究科 修士2年

学籍番号:80031351 e-mail:yo@sfc.keio.ac.jp

小澤陽介

 

概要

近年、終止コドンの周辺領域、即ち翻訳終結部位には終止コドン以外にもコンセンサスパターンがあることがいくつかの種で分かって来ている。しかし、現在の所全ての種でそれが十分に調べられているわけではない。そこで終止コドン下流に出現する顕著な塩基配列パターンを特定するために網羅的コンピュータ解析を原核生物29種と真核生物11種について行った。その結果、翻訳終結部位の下流(+1,+2)で顕著な傾向を発見することができた。

次にこれらのよく保存された塩基配列が翻訳終結効率にどのように影響しているのかを知るため、増加情報量で数値化された塩基の保存性とCAI値によって推定された遺伝子の発現量との関係を調べた。その結果、原核生物72株と真核生物5種で終止コドン下流の複数の位置(+1,+2)で増加情報量とCAI値との間に顕著な正の相関があることがわかった。これはこの位置の塩基の保存性が、多く発現する遺伝子ほど強くなることを示している。

さらに終止コドン認識因子である遊離因子のマルチプルアライメントによる種間比較を行い、終止コドン下流の増加情報量とCAI値との間に顕著な正の相関が見られた種は遊離因子の系統樹を書くとある枝に固まって存在すること、及びそれらの種でのみ保存されたアミノ酸配列の傾向が存在することが分かった。

つまり(1) 終止コドンの下流には有意な塩基の偏りがあり、それらは翻訳終結シグナルの一旦を担っている可能性があること、(2)またそのような塩基のコンセンサス配列は発現量が多い遺伝子ほど、強く現れる傾向があること、(3)ただし(2)のような傾向はすべての種で見られてわけではなく、その傾向の違いはおそらく認識因子の特徴の違いによるということが本論文の解析により示された。

 

 

    解析に使用した生物種一覧


1:解析対象とした生物リスト。原核生物のデータはGenBank、真核生物のデータはNCBIUniGeneを使用した。

 

 

・遺伝子の発現量と翻訳終結部位周辺の情報量との関係

遺伝子の発現量と翻訳終結部位周辺の情報量がどのような関係にあるのかを、増加情報量[7]CAI[8]を用いて調べた。具体的にはCAI値順に遺伝子を10のグループに分け、それぞれのグループごとに各位置における増加情報量を算出し、各位置で増加情報量とCAI値との順位相関係数を算出した。

・結果

 

2:原核生物の増加情報量とCAI値の順位相関係数(終止コドン直後から10塩基)

 


   翻訳終結部位下流の傾向と終止コドン認識因子の相同性との関係

前述の解析では発現量と塩基の保存性との間に顕著な正の相関が見られない種も存在した。このような傾向の違いは何故生じているのだろうか?
 それを探るため、本章では遊離因子と呼ばれる翻訳終結反応に関わる因子に着目する。遊離因子とは終止コドンを認識したり、翻訳終結反応を促進する働きをしたりする因子で、原核生物では3種類、真核生物では2種類、それぞれ存在が知られている[19-21]。内訳としては原核生物では終止コドン認識因子として働く因子が2種類(RF1,RF2)、真核生物では1種類(eRF1)存在し、残り一つずつが翻訳終結反応を促進する働きをする因子(RF3,eRF3)である。特筆すべき点は真核生物では認識因子として働く1種類の遊離因子がすべての終止コドンを認識するのに対し[20,22,23]、原核生物では2種類の遊離因子がそれぞれ2種類の終止コドンを認識することである[19]

この認識因子として働く遊離因子はすでに立体構造が解かれており、tRNAと酷似した立体構造をとる[24]。そのことからtRNA擬態蛋白とも呼ばれているこの認識因子は、認識のメカニズム自体もtRNAのそれと良く似ていて、tRNAがトリヌクレオチド(コドン)でmRNA上の対応するコドンと対合するように遊離因子でもある決まったトリペプチドがmRNA上の終止コドンを認識する。RF1の終止コドンを認識するトリペプチドはP(プロリン)-A(アラニン)-T(トレオニン)で、RF2のそれはS(セリン)-P(プロリン)-F(フェニルアラニン)である。

また原核生物の遊離因子を用いた実験では少なくとも終止コドンの下流3塩基までが、翻訳終結効率(この場合は遊離因子の結合効率)に影響することが知られており、前述の終止コドンの至近における傾向には深く関わってと考えられる[11,12]

そこで認識因子として働く原核生物の遊離因子2種類(RF1,RF2)の網羅的な種間比較を行った。

 

   結果

RF1の系統樹

 


1RF1の系統樹。終止コドンの下流でCAI値と増加情報量との間に強い相関があった種は左上の枝に固まっている。


RF1RF2ともに終止コドンの直後で増加情報量とCAI値が高い相関を示した6つの種(E. coliE. coli O157C. crescentusH. influenzaeV. choleraeP. aeruginosa,N. meningitidis)がそれぞれの系統樹の同じ枝に集まるという結果が得られた。この結果はこれらの種では2つの遊離因子の相同性が高く、かつ他の種とは相対的に相同性が低いことを示している。

翻訳終結部位下流の塩基の保存性とCAI値との相関の種間の傾向の違いは、この認識因子の差異による可能性が高いと考えられる。つまり、終止コドンを認識して、新生タンパクを遊離するという与えられた役目は同じであっても、それを演じる役者の個性が異なれば、演じられる劇も変わってくるということであろう。