2001年度森基金研究育成費森基金成果報告書
真核生物における選択的スプライシングのメカニズム解明
政策・メディア研究科修士課程1年 小知和裕美

3.結果
1.完全長cDNA配列とゲノム配列との比較
表2は、重複領域にマッピングされたcDNAをクラスタリングした際のcDNAのペア数・クラスター数の推移を示す。最終的に、O. sativa では674ク ラスター、M. musculus では107クラスターが導出された。
SpeciesBLASTSIM4pair-wisegrouping
M. musculus38,421 pairs1,275 pairs1,827 pairs107 clusters
O. sativa31,389 pairs6,765 pairs2,617 pairs674 clusters
表2:DNA領域に重複してマッピングされたcDNAクラスター
また、各クラスターについて選択的スプライシングパターンを推定した。以下にスプライシングパターンの模式図[16]とともに、スプライスサイトの分類を示す。
図4:選択的スプライシングのパターン
patternsM. musculusO. sativa
1.16 sites18 sites
2.2 sites10 sites
3.5 sites21 sites
4.25 sites23 sites
5.21 sites158 sites
表3:選択的スプライシングパターンによる分類

次に、興味深い特徴を示した結果をいくつか示す。


図5:Retained intron の例

選択的スプライシングパターンの一つに、イントロンがスプライスアウトされない例がある。下記の図に示されている例は、スプライスアウトされていないイントロンが、3'-末端付近に残っている。 cDNA生成過程にてunspliced なイントロンが残った結果であるかもしれないが、複数あるうちの1つのイントロンが残っているものが多かったため、これらのイントロンには何らかの機能が存在する可能性もあると考えられる。


図6:複数のエクソンが連続してスプライスアウトされる例

cDNA同士のアラインメントで確認されたギャップ領域に複数のエクソンが含まれていたことが、ゲノムにマッピングすることで確認された。下記の図にある例は、そのギャップ領域にエクソンが3つ含まれている。この領域のゲノム配列とcDNAの相同性が100%であることから、複数のエクソンが含まれている可能性が高いと言える。


図7:転写開始点がイントロン内にある例
図8:転写終結点がイントロン内にある例

従来のcDNA同士の比較では導出が不可能であった 4.Mutually exclusive (異なるエキソンが選択されている選択的スプライシングパターン)のクラスターを導出することが可能となった。このパターンに分類された多くが、一方のcDNAのイントロン内にもう一方のcDNAの転写開始点や転写終結点が存在するというケースであり、非常に興味深い結果を得ることができた。

以上のような選択的スプラシングパターンに分類されたクラスターの他にも、一方のcDNAのイントロン内にもう一方のcDNA全体が組込まれているケースや、遺伝子領域がオーバーラッピングしているケースも含まれていた。また、5'末端側や3'末端側のエキソンの数が異なるcDNAクラスターも存在し、選択的プロモーターや選択的poly(A)の関与が示唆される。よって、完全長cDNA配列をゲノム配列にマッピングさせることによって、選択的スプライシング由来のcDNAの他にも 多様なcDNAクラスターを導出できることが示された。

2.マイクロアレイデータを用いた組織特異的cDNAの特定

これまでの研究においてマウスの完全長 21,000 cDNAs より、1,136本のcDNAからなる415クラスターを選択的スプライシング候補として導出した。このうち、マイクロアレイデータの発現パターンがある組織もしくはある発現段階でのみ異なっている4つのクラスターを同定した。以下にそのスプライシングパターンと発現量のグラフを示す。

cluster ID:2204 にグルーピングされた2本のcDNAは、Prolaction-like-peptideと相同性が高かった。 Prolaction-like-peptideは prolaction (PRL)/growth hormone (GH) gene として知られており、pituitary gland, uterus や placenta にて発現することが報告されている[17]。図*より、seq ID: 4107は placenta で発現しているが thymus や uterusでは発現していないことが分かる。一方、Seq ID: 3784 は thymus や uterusにて高い発現量を示している。このことから、1つのエキソンが選択的にスプライスアウトされることによって、組織特異的に作用するタンパク質を作り出すことが考えられる。

cluster ID:3082 にグルーピングされた3本のcDNAは、28S Ribosomal protein S17[18]と相同性が高かった。このクラスターでは、コード領域外の5'UTR領域において選択的スプライシングが行われており、タンパク質をコードするORF領域は3本ともに一致している。また、図*より、これらのcDNAはマウスの皮膚の成長過程においてそれぞれの発現量が段階的に制御されていることが分かる。5'UTRや3'UTRにおける選択的スプライシングは、遺伝子の発現量を制御する働きをする[3]ことから、この遺伝子は皮膚の発現段階に応じて選択的スプライシングによってRibosomal protein の発現量を変化させていることが示唆される。

cluster ID: 3138 にグルーピングされた2本のcDNAは、TIA-1 cytotoxic granule-associated RNA-binding protein-like 1 と相同性が高かった。このタンパク質は、12.5日目の胎児のbrain や retinaで発現しており、また lung, kidney や thymus においても発現することが認められている[19]。cluster ID:3082 と同様、3'UTR領域において選択的スプライシングが行われることにより、胎児の脳の発育段階に応じて遺伝子の発現量が制御されている可能性がある。

cluster ID: 3148 にグルーピングされた2本のcDNAは、bisphosphate 3'-nucleotidase [20]と相同性が高かった。このタンパク質は選択的スプライシングパターンをもつことは知られていない。今回見出されたスプライシングパターンによって、選択的にスプライスアウトされるエキソンの中にスタートコドンが存在し2種類のスタートコドンにて翻訳開始していることが予測される。

3.選択的スプライシングサイト周辺配列の解析

マウス及びヒトの既知選択的スプライシングによるmRNAを公共のデータベースであるGenBankより抽出し、前述の手法によりゲノム配列へのマッピングを行った。GenBankデータより抽出した既知選択的スプライシングによるmRNAの数と、ゲノム配列とのマッピングに成功したmRNAの数とを以下に示す。

SpeciesNo. of datasetNo. of datasets successfully
M. musculus mRNA45331
H. sapiens mRNA2,5421,680
表4:GenBankより抽出したmRNAの総数

M. musculus はマッピングに成功したmRNAの数が少なかったため、統計的に有意義な結論を出すのには不十分と判断されたことから、今回の解析ではH. sapiens のみを対象とした。選択的なスプライスサイト周辺配列と通常のスプライスサイト周辺配列の比較解析をするにあたり、各スプライスサイトの周辺8bpを抽出し、以下の表にまとめた。

また、スプライスサイト周辺配列は、以下に示されるコンセンサス配列に従うことが知られている[21]

  • 3' splice sites: CAG|G
  • 5' splice sites: MAG|GTRAGT where M is A or C and R is A or G
8bp around 5'-splice sites (Control Group)
-8 -7 -6 -5 -4 -3 -2 -1 +1 +2 +3 +4 +5 +6 +7 +8
A 1056 1055 1121 1121 1131 1296 2306 456 53 51 2104 2457 387 709 1045 820
T 926 824 904 902 728 470 521 310 56 3620 158 429 289 1645 730 980
G 806 912 851 821 852 612 431 2818 3538 23 1317 528 2776 761 1188 954
C 957 954 869 901 1033 1367 487 161 93 47 162 327 289 625 776 984
8bp around 5'-splice sites (Alternatively Spliced)
-8 -7 -6 -5 -4 -3 -2 -1 +1 +2 +3 +4 +5 +6 +7 +8
A 534 553 574 564 598 583 1050 275 57 49 971 1141 263 375 523 437
T 419 415 402 455 355 258 290 181 53 1741 117 270 188 813 418 481
G 446 462 435 385 427 337 279 1304 1670 36 671 279 1252 373 572 467
C 481 450 469 476 500 702 261 120 93 47 114 183 170 312 360 487
8bp around 3'-splice sites (Control Group)
-8 -7 -6 -5 -4 -3 -2 -1 +1 +2 +3 +4 +5 +6 +7 +8
A 399 437 383 375 855 251 3615 98 1047 973 960 1004 1001 971 1028 1181
T 1615 1628 1648 1904 991 991 51 44 436 1301 936 920 948 863 767 830
G 438 404 335 245 741 68 31 3505 1714 798 934 846 886 947 1046 841
C 1284 1267 1368 1212 1151 2428 42 92 548 673 914 975 910 964 904 893
8bp around 3'-splice sites (Alternatively Spliced)
-8 -7 -6 -5 -4 -3 -2 -1 +1 +2 +3 +4 +5 +6 +7 +8
A 228 253 223 223 459 178 1732 97 558 521 475 497 532 509 563 581
T 808 758 851 922 492 481 57 49 250 615 481 457 497 402 389 419
G 218 258 161 159 371 65 39 1635 732 397 485 433 431 478 464 427
C 623 608 642 573 555 1152 49 96 340 347 439 493 420 491 463 453
表5:スプライスサイト周辺配列の比較

上述の表を見る限り、選択的なスプライスサイトと通常のスプライスサイトは共にコンセンサス配列に従っているようである。また、それぞれのスプライスサイト周辺配列に統計的に有意義な差があるかを検証するため、カイ2乗検定を行った。結果、統計的に有意義な差はなく、選択的なスプサイスサイトと通常のスプライスサイトの周辺配列には違いがないという結論に達した。


[TOPへ 1. はじめに 2. 研究手法 3. 結果 4. 考察 5.今後の展望 6. 参考文献 7. 実績 ]