2001年度森基金研究育成費成果報告書

２．研究手法

１．使用したデータ

今回の研究には、以下のデータを使用した。理化学研究所のマウス fulll-length cDNAは公開済であるが、農林資源研究所のイネ full-length cDNAは未公開データである。また、M. musculus のmicro-array dataは、選択的スプライシング候補のcDNAについてまとめられたデータベースを理化学研究所から提供されたものを使用した。

Species	Data forms	Database
M. musculus	full-length cDNA	RIKEN
	genomic DNA	NCBI
	GenBank	NCBI
	micro-array data	RIKEN
O. sativa	full-length cDNA	RGP
	genomic DNA	RGP
	GenBank	NCBI
H. sapiens	genomic DNA	NCBI
H. sapiens	GenBan	NCBI

表１：使用したデータ

２．完全長cDNA配列とゲノム配列との比較

マウス・イネの完全長cDNAは、以下の図に示される3ステップでゲノム配列へマッピングされる。

図１：cDNA－genomic DNA マッピング手法

STEP1: BLAST [12]
BLASTによってcDNA配列とゲノム配列とを総当たりの形で相同検索を行う。cDNA配列と高い相同性を示したゲノム配列の候補を抽出することで、次のステップを効率よく行うことができる。
STEP2: SIM4 [13]

BLAST結果を基に、cDNA配列と高い相同性を示した領域の範囲をゲノム配列から抽出し、SIM4により詳細なペアワイズアラインメント行う。SIM4はイントロンとエキソンの境界に注目したアラインメントを行うことができ、特にスプライスされる前のゲノム配列と後の配列とのホモロジー検索をするのに最適なツールである。
STEP3: grouping (perl programm)
ペアワイズアラインメントの結果を利用して、同じゲノム領域にマッピングされたcDNA同士をグルーピングした。cDNA ライブラリには重複cDNAが含まれているため、これらを除外する必要がある。そのために、ゲノム上にマッピングされた末端の位置が異なるcDNA同士であっても、エキソン数が等しい場合は重複クラスターとみなし除外する、という条件を設定した。

３．マイクロアレイデータを用いた組織特異的cDNAの特定

我々はこれまでの研究により、マウスの完全長cDNA 21,076本のうち、1,136本のcDNAからなる415グループを選択的スプライシング候補のcDNAクラスターとして特定した。理化学研究所は完全長cDNAを作成するにあたり、マイクロアレイによって組織・発育段階別（49種類）にmRNAの発現量を測定し収集してきた。これまで18,816本のcDNAについて測定されたものがWEB上にて公開されている[14]。マイクロアレイデータは、発現パターンが類似するタンパク質には何らかの関連性があるという名目のもと、多数の遺伝子を発現パターンによって任意の数の遺伝子群に分類し、クラスタリングされた遺伝子がコードするタンパク質の同定に利用されることが多い。我々はこの発現量が表されたマイクロアレイデータを利用し、選択的スプライシングとして推定されたクラスターのうち異なる組織・発育段階にて発現の量が大きく変化するものを同定した。

図２：マイクロアレイデータの例

同定手法としては、縦軸に発現量、横軸に組織・発育段階（実験条件）をとって各cDNA毎の発現量をグラフ化し、一部分だけ異なる波形をとっているクラスターを抽出した。また、予測されたORF (open reading frame)情報を用い、選択的にスプライスアウトされるエクソンがORF内にあるcDNAについては、エキソン内にタンパク質のモチーフが存在するかどうかをhmmpfam[15]を用いて検索した。

４．選択的スプライシングサイト周辺配列の解析

選択的スプライシングの制御配列を探るにあたり、まず公共のデータベースであるGenBankに 'alternative splicing（選択的スプライシング）' の記述がなされているmRNAを抽出し、既知選択的スプライシングmRNAのデータセットを作成した。これらのmRNA配列を上述の方法にてゲノム配列と比較し、エキソン／イントロンの情報を取得した。この情報をもとに各スプライスサイト周辺8bpを抽出し、選択的なスプライスサイト周辺配列と通常のスプライスサイト周辺配列の比較解析を行った。

図３：選択的スプライシングの模式図

[TOPへ 1. はじめに 2. 研究手法 3. 結果　 4. 考察　 5.今後の展望 6. 参考文献 7. 実績 ]