分類によるSD配列と16S rRNA結合自由エネルギーの分析

慶應義塾大学 政策・メディア研究科
修士課程2年 長田木綿子
osada@sfc.keio.ac.jp

始めに

そもそも翻訳開始は一つ一つの遺伝子に対して個別に行なわれる現象である。上の解析で算出された自由エネルギーは、各々の遺伝子個別に観察した場合、どのような分布を示すのだろうか。以下の項目により遺伝子を分類し分析を行う。

 

波形による分類

手法

分類方法:

1遺伝子を1系列として自由エネルギー値をプロットし線型グラフを描く。それぞれの系列の波形により、遺伝子を分類して示した。

パラメータ:

ウィンドウ・ゲージを12塩基長に設定。50塩基上流から50塩基下流までの自由エネルギーを算出した。

自由エネルギー値の基づく配列データ・セット:

データベース中のアノテーションは、必ずしも実際に遺伝子発現の実験を行って遺伝子領域が決定されたものばかりではない。したがって、遺伝子領域の同定ミスが含まれている可能性がある。個別にデータを見ていく場合、このようなノイズの影響を直接的に受けてしまう。その結果、解析結果の信頼性が低くなる。

上の欠点を克服するため、本研究では、実験で発現したタンパク質から、N末端の決定されたデータのみを利用することによってこの問題点を解消することができる。E. coliの実験によるデータを利用して解析を行なった []。開始コドンのアノテーションの信頼性が高いため、開始コドンを規準としてポジションを設定することができる。この中からランダムにピックアップした100遺伝子をサンプルとして利用した。

結果:

まず、サンプルのほとんどが、自由エネルギーの低い""を持つことがわかった。最も典型的なものは、−22から−10ポジションの間に、−12から−8くらいの谷が存在しているものである(図 1、図 3)。

一方で、遺伝子を個々に見ていくと、必ずしも全ての遺伝子で、ゲノム全体の平均値でみられたようなSDらしきポジションにおいて自由エネルギーが低下するわけではないことがわかった。(図 2、図 4

また、上流に (-50nt -30nt) に、谷があるものが存在する。(図 3、図 4

まとめ・考察:

RNAの位置と自由エネルギー:

自由エネルギーの低下する位置は、はっきりと-16-8の間が多いことが分かった。(ウィンドウのゲージが12bpの場合)

-16 の場所で値が低い場合、ウィンドウには-16 から -4 の塩基が含まれる。一般的にSD配列があると言われる -10bp 周辺の塩基を含んだ位置において、低い自由エネルギー値が算出された。一般的な説と一致した結果となった。

自由エネルギー低下がみられない遺伝子が存在:

開始コドンの認識のシグナルと成りうると思われるような、自由エネルギー低下の顕著な部位がない遺伝子も存在した。

E.coliにも、開始コドンの認識にRNA鎖同士の対合を利用せず、まったく別のメカニズムに拠って翻訳開始を行っている遺伝子もある事を支持する結果となった。

複数の谷を持つもの:

上流に atg が存在するものもあるが、どちらもフレームが異なる。 この様な場合、どのようにして下流のatgを選択できるのか、疑問が残る。

全体を通して:

典型的なパターンに当てはまる遺伝子が多かった事から、多くの遺伝子は一つのSDをもち、翻訳開始のシグナルとして利用しているという説がよく当てはまる。次に、複数の谷を持つサンプルは、このような遺伝子が、開始コドンを複数持つ可能性を示唆しているかもしれない。まったく谷のわからないような波形のものや、ゆるいカーブのものについては、SD配列以外のメカニズムについて、よく検証してみる必要があると考える。

 

グラフ

1 典型的なパターンにあてはまる遺伝子

2 はっきりとした谷を持たない遺伝子

3 谷を複数持つ遺伝子:
SDらしきポジションのほかに、上流にも値の低いポジションがある。

4 上流に谷がある遺伝子:
SDらしきポジションははっきりしないが、上流に顕著に値の低いポジションがある

開始コドンによる分類

原核生物には開始コドンとなりうるものがAUGの他にも存在する。AUGGUGUUGがの3つが開始コドンとして機能するが、ほとんどの生物でAUGが利用されることが多い(図 5)。これらの間で、16S rRNAの結合する傾向に違いがあるだろうか。

手法

分類方法:

遺伝子を開始コドン別に分け、それぞれの平均値を比較分析した。

パラメータ:

ウィンドウ・ゲージを12塩基長に設定。50塩基上流から開始コドンまでの自由エネルギーを算出した。

 

結果・考察

進化的に近い主であるE. coliH. influenzaeにおいては、GUGよりもAUGの方がSD周辺の自由エネルギー値が低い。H. influenzaeでは、GUGの場合、SD周辺でも値の低下が見られない(図 6、図 7)。

B. subtilisでは、どの開始コドンも一様にSD周辺で値が低い(図 8)。

Synechocystisでは、AUGGUGともに、SD周辺で値が低いが、GTGの場合のほうが比較すると多少低い傾向がある(図 9)。

古細菌のM. jannaschiiは、H. influenzaeと似ていて、ATG以外の開始コドンの場合は、SDで値が下がるという現象が見られない(図 10)。

ゲノムの平均で見てもSDらしい兆候の見られないM. genitaliumは、開始コドン別に分けても値の低下するポジションが見られなかった(図 11)。

以上の結果から、B. subtilis以外のものでは、開始コドンによってSD配列に対する依存度が異なる可能性が示された(特に、M. jannaschiiH. influenzaeのでは、GTGの場合、自由エネルギーが低下しないのが特徴的である)。ただし、SDのポジションでの自由エネルギーが低い開始コドンがATGGTGのどちらであるかは生物によって異なる。従って、どの開始コドンの場合に依存度が高い/低いといった議論はできない。

開始コドンとSDに依存した翻訳開始とは直接相関がないかもしれないが、両方が遺伝子の進化と関連している可能性があるという解釈ができるかもしれない。どの生物も、もともとはATGを開始コドンとしていたが、進化のある時点でGTG開始コドンも採用するようになる。あらたな遺伝子(GTG開始コドン)は、翻訳開始におけるSDに対する依存度が元からある遺伝子(ATG開始コドン)とは違っていた、という事ではないだろうか。

5 開始コドンの分布:
数値はそれぞれ個数をあらわす。利用される開始コドンは、ほとんどが
AUGコドンである。

6 E. coliコドン別自由エネルギー

7 H.influenzaeコドン別自由エネルギー

8 B.subtilisコドン別自由エネルギー

 

9 Synechocystisコドン別自由エネルギー

10 M. jannaschiiコドン別自由エネルギー

11  M. genitaliumコドン別自由エネルギー

遺伝子間の距離による分類

原核生物はDNAからmRNAが転写されるときに、複数の遺伝子領域を一緒に転写して一本のmRNAから複数の遺伝情報を翻訳し、発現している。本研究では、複数の遺伝子がオペロン構造をとっていれば、遺伝子間の距離は短くなるのではないかとの仮説をたて上流の遺伝子の距離別に遺伝子を分類した。オペロンでは、1番目の遺伝子を翻訳したリボソームがmRNAを離れず、そのまま下流の遺伝子を次々と翻訳していく。この時、下流の遺伝子では、SDに依存しない翻訳開始が可能なのではないだろうか。

手法

分類方法

以下のように上流遺伝子から開始コドンまでの距離で遺伝子を分類した。

 

1 上流遺伝子からの距離別分類

 

distance

< 0(overlap gene)

0 <=

distance

< 20

20 <=

distance

< 40

40 <=

distance

< 60

60 <=

distance

< 80

80 <=

distance

< 100

120 <=

distance

< 140

140 <=

distance

 

 

パラメータ:

ウィンドウ・ゲージを12塩基長に設定。50塩基上流から開始コドンまでの自由エネルギーを算出した。

結果・考察

上流遺伝子からの距離では、SD付近の自由エネルギーは、分類されなかった。それぞれの系列の自由エネルギーを示す線グラフは、とても似通った形状のカーブである。それに、生物によって、自由エネルギーの低い系列が異なる(図 12、図 13)。上流遺伝子との距離が近いものは、オペロン構造の2番目以降に位置する遺伝子であるいう最初の仮説が間違っているのかもしれない。

特筆すべきなのは、SD配列が上流遺伝子のコード領域と重なってしまう、オーバーラップ遺伝子の場合も、SD配列依存の翻訳開始を示唆すことである。SDのポジションの自由エネルギー値は他のポジションと比べて顕著に低い(図 12、図 13)。リボソームは、mRNAを一定の方向(5'3')に進み、逆行はしない。従って、オーバーラップ遺伝子の場合は、例え一つのmRNAの上流に遺伝子があったとしても、別のリボソームによって新しく翻訳が開始されなければならない。この場合、翻訳開始にSD配列が必要とすると、上の結果は論理的に説明することができる。

12  E. coli距離別自由エネルギーの分布

13 H. influenzae距離別自由エネルギーの分布