1998年度森泰吉郎記念研究復興基金
博士課程研究助成金報告書
慶應義塾大学政策・メディア研究科博士課程
斎藤輪太郎
森基金の助成により
1998年度は文献の購入、論文の複写、研究に使用するPCの周辺機器の購入を不自由なく行うことができ、効率よく研究を進めることができた。以下に研究成果を述べる。
塩基配列パターン“ATG”は開始コドンと呼ばれる暗号として使われている。したがってこれと同じパターンが開始コドンの周辺に存在していると、蛋白質の合成が正しく行われなくなるため、進化的に開始コドン周辺のATGには淘汰圧がかかっているはずである。我々は様々な生物でATGの頻度が開始コドン周辺でどのように変化するか、解析した。その結果、真核生物と原核生物では頻度の変化が大きく異なることが判明した。これは原核生物ではリボソームと呼ばれる細胞小器官が直接mRNAに結合するのに対して、真核生物ではリボソームがmRNA上をスライドするという仮説をサポートする。
・
ヒトの開始コドン周辺のATGの分布と大腸菌の開始コドン周辺のATGの分布
Mycoplasma genitalium
は最小のゲノムを持つ生物として知られているが、翻訳開始のプロセスについては不明な点が多い。とくに原核生物に特有なSD配列が見当たらない。そこでこの生物の翻訳開始領域の配列をコンピュータで解析した。その結果、”TAA”というパターンが翻訳開始領域上流に顕著に出現することが判明した。このパターンが翻訳開始に関わっている可能性が高い。Mycoplasma genitalium
の翻訳開始領域周辺のTAAの頻度
細胞小器官リボソームとmRNAが結合する際の自由エネルギーを計算するプログラムを作成した。解析は長田氏によって行われ、原核生物ではリボソームがmRNA上のSD配列に結合することによって翻訳が開始されると思われていたが、生物によっては必ずしもそうでない可能性があることが判明した。
and 5' UTR for translation initiation in various procaryotes,Bioinformatics(In press.)
リボソームはどのようにして数あるAUGというパターンの中から開始コドンを見分けるのだろうか?そのモデルを一階述語論理というヒトに理解しやすい形で作るため、PROGOLを使い、翻訳開始領域の学習実験を行った。その結果、今までよく知られているSD配列を発見することができた。その他に
atcやtatなど従来のモデルにはない新しいパターンを発見することができた。しかし、予測的中率は84%程度。今後様々なモデルを取り入れる必要があるだろう。trans_start(A) :- up_seq(A,B), sd1_apatloc([a,a,g],B,14).
trans_start(A) :- up_seq(A,B), triplet_apatloc([a,t,c],B,19).
trans_start(A) :- up_seq(A,B), triplet_apatloc([t,a,t],B,21).
trans_start(A) :- up_seq(A,B), sd1_apatloc([a,a,g],B,9), triplet_apatloc([a,
a,a],B,17).
trans_start(A) :- up_seq(A,B), sd2_apatloc([a,g,g],B,16), sd4_apatloc([g,
a,g],B,15).
PROGOL(帰納的推論システム)によって生成された開始コドン決定のモデル
ヒトなどの霊長類にはALU配列と呼ばれる繰り返し配列がDNAに何万コピーも存在するが、その役割に関しては不明な点が多い。ALU配列の挿入部位には何か特徴があるのではないかと考え、塩基配列パターン解析プログラムを作成した。実際の解析は戸田氏によって行われたが、ALU挿入部位に特有なパターンTnAnを発見することができた。
ウィルスを除くあらゆる生物は蛋白質の合成に欠かせないrRNAの遺伝子を持っている。これが発現するためにはプロセッシングという反応が必要である。プロセッシングはrRNAの両末端のステム構造を標的にして起こるといわれているが、それが全生物共通であるかは定かでない。我々は様々な生物のrRNAの両末端の塩基配列をもとに、ステム構造ができるかどうかを推測した。その結果、一部の生物においてはrRNAの両末端がステム構造をとらない可能性があることが判明した。