2002年度森基金 研究成果報告
マウスcDNAライブラリを用いた新規non-coding RNA候補遺伝子の探索及びその発現解析
政策・メディア研究科修士課程2年
先端生命科学研究所
沼田興治 <numassan@sfc.keio.ac.jp>

概要

近年,様々な生物種におけるゲノム配列,転写産物の大規模な解析が行われたことにより, タンパク質をコードしないRNAとして機能する分子(non-coding RNA; ncRNA)の重要性が明白な ものになった.特に真核生物においては,キャップ構造付加,スプライシング,polyA付加など のmRNA様の修飾をうけるncRNAに関する報告が増えつつある.
本研究ではマウス完全長cDNAコレ クション(60,770配列)を用いて,新規ncRNAの候補配列の抽出を行った.同コレクションは, 理化学研究所によって収集された完全長の遺伝子配列群で,マウス全遺伝子の約90%を網羅してい ると考えられている.
結果,4,280のlargest-candidate-setを抽出し,そのいくつかは,マウス EST配列との相同性や,転写開始点のCpG islandsが見られ,さらにいくつかはヒトゲノム上にも 保存されていることを明らかにした.以上は,マウスにおいて予想以上に多くのncRNAが存在し, それらが生体内において重要な機能を担っていることが示唆している.また実験を開始し,RT-PCR による発現解析では二つの候補について,その組織ごとの発現の解析を行った.

本研究成果は,そのサマリーが理化学研究所によるマウスcDNA論文の一部として掲載された(成果実績2参照).

新規候補配列のスクリーニング

FANTOM2セットからの新規候補配列抽出には以下のような手続きを経た.マウス 転写単位配列セット(37,086)のうち,各々のクラスタに属する配列のCDS注釈 によって,各転写単位からタンパク質配列が生成できず,”Non-protein-coding TU”と定義された15,815配列をスクリーニングにおけ る初めのセットとして用いた.既知アミノ酸配列との相同検索では, ftp://us.expasy.org/databases/sp_tr_nrdb/ よりダウンロードした既知アミノ酸配列セットを検索対象データベースとして, BLASTXプログラムにより相同検索を行った.出力された結果より,期待値 (E-value)が1.0-5以下のものは既知アミノ酸配列と相同であると定義し,同様 の配列を除去した.各配列のマウスゲノム(MGSCv3)へのマッピングはBLASTプ ログラムとSIM4プログラム http://globin.cse.psu.edu/html/docs/sim4.html を用いた. これにより,配列の類似性が90%以上かつ全長の90%以上がアラインされるもの以外は それを除去した.さらに,GENSCANプログラム http://genes.mit.edu/GENSCANinfo.html によ るゲノム上でのタンパク質コード領域予測も考慮し,各配列がマッピングされた 領域の10kb周辺でタンパク質のコード領域が予測される場合は,同配列を候補か ら除去した.

同閾値は,類似した解析をシロイヌナズナEST配列を用いて行ったMacIntosh et al.らの手法に基づく. 上記の過程を経て4,280配列の重複のないncRNA候補を抽出した.各過程における配列数を 表1を参照.

二候補配列,及び既知ncRNAの発現解析

[目的] 既知ncRNA二種類,新規候補二種類を組織ごと(11組織)のTotal RNAをもとと してRT-PCR法によって増幅することにより,各組織における同配列の存在確認を 行う.新規ncRNA候補としてTE13, TF84, 既知ncRNAとして,H19とMsx1asの二つの増幅を行う.H19はImprinting領域におけるncRNAとして知られる遺伝子で,母親由来の染色 体から,特にマウス発生段階における各組織で発現していることが知られている. Msx1asはマウス骨細胞の発生に関わる遺伝子Msx1 とSense-antisenseに重なり,その発現はMsx1タンパク質の翻訳レベルの抑制に 関わっていると考えられている.

[結果と考察] 結果を図1に示す. H19, Msx1asの既知候補配列に関しては,すでに報告されているものと同じような結果を得ることができた. 新規ncRNAの候補である二つ(TE13, TF84)は,それぞれ対象的な発現パターン を示した.まずTE13は,解析に用いた全11組織における発現が確認された.既知 のmRNA-like ncRNAを見ると,ImprintingやDosage compensationに関わるものを 見ても,組織特異的な発現をするものが目立つ.仮にTE13がncRNAとしての機能 をもち,その発現が組織の違いによらない恒常的なものだとすると,転写や翻訳, 染色体の複製,骨格構築など組織細胞における根本的な機能を有している可能性 があり,そのようなncRNAの報告がまだないことから見ても,同定に向けた機能 解析は非常に有意義である.一方,組織特異的な発現が見られたTF84は,腎臓, 脳,心臓,胎児,肺,乳腺での発現が見られた.本解析からの機能推定は不可能 なことであるが,コンピュータを用いた予測による候補配列が実際にマウス各組 織で特異的な発現パターンを示したという点では有意義な結果といえよう.

成果実績(2002年度)

1. Numata K., Kanai A., Saito R., Kondo S., Adachi J., Wilming L.G., Hume D.A., RIKEN GER Group Members, Hayashizaki Y., Tomita M.; “Identification of putative non-coding RNAs amongst the RIKEN mouse full-length cDNA collection”; Accepted

2. The FANTOM Consortium and The RIKEN Genome Exploration Research Group Phase I & II Team (2002). “Analysis of the mouse transcriptome based on functional annotation of 60,770 full-length cDNAs”. Nature 420: 563-573 -> PDF

3. Koji Numata, Akio Kanai, Shinji Kondo, Jun Adachi, Rintaro Saito, Masaru Tomita; "Systematic extraction of putative non-coding RNAs in RIKEN cDNA library"; FANTOM2 Cherry Blossom Meeting (2002, Yokohama)