慶應義塾大学 政策・メディア研究科
修士課程2年 長田木綿子
始めに
そもそも翻訳開始は一つ一つの遺伝子に対して個別に行なわれる現象である。上の解析で算出された自由エネルギーは、各々の遺伝子個別に観察した場合、どのような分布を示すのだろうか。以下の項目により遺伝子を分類し分析を行う。
1遺伝子を1系列として自由エネルギー値をプロットし線型グラフを描く。それぞれの系列の波形により、遺伝子を分類して示した。
ウィンドウ・ゲージを12塩基長に設定。50塩基上流から50塩基下流までの自由エネルギーを算出した。
データベース中のアノテーションは、必ずしも実際に遺伝子発現の実験を行って遺伝子領域が決定されたものばかりではない。したがって、遺伝子領域の同定ミスが含まれている可能性がある。個別にデータを見ていく場合、このようなノイズの影響を直接的に受けてしまう。その結果、解析結果の信頼性が低くなる。
上の欠点を克服するため、本研究では、実験で発現したタンパク質から、
N末端の決定されたデータのみを利用することによってこの問題点を解消することができる。E. coliの実験によるデータを利用して解析を行なった []。開始コドンのアノテーションの信頼性が高いため、開始コドンを規準としてポジションを設定することができる。この中からランダムにピックアップした100遺伝子をサンプルとして利用した。まず、サンプルのほとんどが、自由エネルギーの低い
"谷"を持つことがわかった。最も典型的なものは、−22から−10ポジションの間に、−12から−8くらいの谷が存在しているものである(図 1、図 3)。一方で、遺伝子を個々に見ていくと、必ずしも全ての遺伝子で、ゲノム全体の平均値でみられたようなSDらしきポジションにおいて自由エネルギーが低下するわけではないことがわかった。(図
2、図 4)また、上流に
(-50nt 〜 -30nt) に、谷があるものが存在する。(図 3、図 4) RNAの位置と自由エネルギー:自由エネルギーの低下する位置は、はっきりと
-16〜-8の間が多いことが分かった。(ウィンドウのゲージが12bpの場合)-16 の場所で値が低い場合、ウィンドウには-16 から -4 の塩基が含まれる。一般的にSD配列があると言われる -10bp 周辺の塩基を含んだ位置において、低い自由エネルギー値が算出された。一般的な説と一致した結果となった。
開始コドンの認識のシグナルと成りうると思われるような、自由エネルギー低下の顕著な部位がない遺伝子も存在した。
E.coli
にも、開始コドンの認識にRNA鎖同士の対合を利用せず、まったく別のメカニズムに拠って翻訳開始を行っている遺伝子もある事を支持する結果となった。上流に
atg が存在するものもあるが、どちらもフレームが異なる。 この様な場合、どのようにして下流のatgを選択できるのか、疑問が残る。典型的なパターンに当てはまる遺伝子が多かった事から、多くの遺伝子は一つの
SDをもち、翻訳開始のシグナルとして利用しているという説がよく当てはまる。次に、複数の谷を持つサンプルは、このような遺伝子が、開始コドンを複数持つ可能性を示唆しているかもしれない。まったく谷のわからないような波形のものや、ゆるいカーブのものについては、SD配列以外のメカニズムについて、よく検証してみる必要があると考える。
グラフ
原核生物には開始コドンとなりうるものが
AUGの他にも存在する。AUG、GUG、UUGがの3つが開始コドンとして機能するが、ほとんどの生物でAUGが利用されることが多い(図 5)。これらの間で、16S rRNAの結合する傾向に違いがあるだろうか。遺伝子を開始コドン別に分け、それぞれの平均値を比較分析した。
ウィンドウ・ゲージを12塩基長に設定。50塩基上流から開始コドンまでの自由エネルギーを算出した。
進化的に近い主である
E. coliとH. influenzaeにおいては、GUGよりもAUGの方がSD周辺の自由エネルギー値が低い。H. influenzaeでは、GUGの場合、SD周辺でも値の低下が見られない(図 6、図 7)。B. subtilis
では、どの開始コドンも一様にSD周辺で値が低い(図 8)。Synechocystis
では、AUG・GUGともに、SD周辺で値が低いが、GTGの場合のほうが比較すると多少低い傾向がある(図 9)。古細菌の
M. jannaschiiは、H. influenzaeと似ていて、ATG以外の開始コドンの場合は、SDで値が下がるという現象が見られない(図 10)。ゲノムの平均で見ても
SDらしい兆候の見られないM. genitaliumは、開始コドン別に分けても値の低下するポジションが見られなかった(図 11)。以上の結果から、
B. subtilis以外のものでは、開始コドンによってSD配列に対する依存度が異なる可能性が示された(特に、M. jannaschiiとH. influenzaeのでは、GTGの場合、自由エネルギーが低下しないのが特徴的である)。ただし、SDのポジションでの自由エネルギーが低い開始コドンがATG・GTGのどちらであるかは生物によって異なる。従って、どの開始コドンの場合に依存度が高い/低いといった議論はできない。開始コドンと
SDに依存した翻訳開始とは直接相関がないかもしれないが、両方が遺伝子の進化と関連している可能性があるという解釈ができるかもしれない。どの生物も、もともとはATGを開始コドンとしていたが、進化のある時点でGTG開始コドンも採用するようになる。あらたな遺伝子(GTG開始コドン)は、翻訳開始におけるSDに対する依存度が元からある遺伝子(ATG開始コドン)とは違っていた、という事ではないだろうか。
原核生物はDNAからmRNAが転写されるときに、複数の遺伝子領域を一緒に転写して一本のmRNAから複数の遺伝情報を翻訳し、発現している。本研究では、複数の遺伝子がオペロン構造をとっていれば、遺伝子間の距離は短くなるのではないかとの仮説をたて上流の遺伝子の距離別に遺伝子を分類した。オペロンでは、1番目の遺伝子を翻訳したリボソームがm
RNAを離れず、そのまま下流の遺伝子を次々と翻訳していく。この時、下流の遺伝子では、SDに依存しない翻訳開始が可能なのではないだろうか。以下のように上流遺伝子から開始コドンまでの距離で遺伝子を分類した。
表
1 上流遺伝子からの距離別分類
distance |
< 0(overlap gene) |
|
0 <= |
distance |
< 20 |
20 <= |
distance |
< 40 |
40 <= |
distance |
< 60 |
60 <= |
distance |
< 80 |
80 <= |
distance |
< 100 |
120 <= |
distance |
< 140 |
140 <= |
distance |
ウィンドウ・ゲージを12塩基長に設定。50塩基上流から開始コドンまでの自由エネルギーを算出した。
上流遺伝子からの距離では、
SD付近の自由エネルギーは、分類されなかった。それぞれの系列の自由エネルギーを示す線グラフは、とても似通った形状のカーブである。それに、生物によって、自由エネルギーの低い系列が異なる(図 12、図 13)。上流遺伝子との距離が近いものは、オペロン構造の2番目以降に位置する遺伝子であるいう最初の仮説が間違っているのかもしれない。特筆すべきなのは、
SD配列が上流遺伝子のコード領域と重なってしまう、オーバーラップ遺伝子の場合も、SD配列依存の翻訳開始を示唆すことである。SDのポジションの自由エネルギー値は他のポジションと比べて顕著に低い(図 12、図 13)。リボソームは、mRNAを一定の方向(5'→3')に進み、逆行はしない。従って、オーバーラップ遺伝子の場合は、例え一つのmRNAの上流に遺伝子があったとしても、別のリボソームによって新しく翻訳が開始されなければならない。この場合、翻訳開始にSD配列が必要とすると、上の結果は論理的に説明することができる。