The evolving doublecortin (DCX) superfamily

Identification of proteins with a DCX domain

ヒトとマウスのプロテオームからヒトDCXドメインと同様の配列を検索し、合計22個のDCX反復を持つタンパク質(表1、本研究に用いた全配列は補足図にあり)を発見した。

Table 1 DCXドメインを1つまたは2つ含むヒトおよびマウスタンパク質間の配列関係
Figure 1

A.(図1)

DCXドメインを含むマウスタンパク質。 DCXドメインを含むヒトとマウスのタンパク質の模式図。 DCXドメインはDCXのN-末端リピートにより類似しているものは緑で、C-末端リピートにより類似しているものは紫でラベルされた。 プロテインキナーゼドメインは黄色で表示した。 リシンドメインは茶色で表示した。 ヒトのタンパク質は上に、マウスのタンパク質は下に配置されている。 B. UCSCサイトを用いたヒトとマウスのDCXドメイン遺伝子の染色体上の位置の模式図 .

セリン/スレオニンプロテインキナーゼドメインが3つのヒト/マウスタンパク質(DCLK、DCLK2、DCLK3)に見られ、糖鎖を結合すると予想されるリシンドメインがFLJ46154と称するヒト/マウスタンパク質で発見されていた。 ヒトのFLJ46154とDCDC2Bは他のタンデムリピートタンパク質とは構造が異なり、このタンパク質のN末端部分に現れるDCX C-ターミナルリピートにより近いリピートとDCX N-ターミナルリピートにより近い第2のリピートを含んでいた。 この2つのタンパク質のマウスオルソログでは、DCXドメインは1つだけであった。 すべてのマウス遺伝子は染色体領域(図1b)に存在し、それらはヒトのオルソログと相同であった(補足図2)。 この中にはDCDC1とBAC26042の位置も含まれているが、配列の類似性はDCXドメインのみ非常に低く(52%、86アミノ酸中46アミノ酸)、後述の系統進化学的解析から両者は異なることが判明しており、真のオルソログとは言えない。 また、BAC26042はFLJ46154と物理的に近接していることも特徴であり、これら2つの遺伝子間の距離はわずか2kbであることから、両者は共通の制御要素を持つ可能性が示唆された

本研究はDCXドメインに焦点を当てており、全長タンパク質は対象外であった。 個々のDCXドメインについて、N末端とC末端の部分を分離して系統解析を行った(図2)。 ヒトとマウスのDCXドメインの系統解析から、いくつかの興味深い特徴が浮かび上がってきた。 ヒトの遺伝子の大部分にはマウスのオルソログがあった。 2つの遺伝子は明確なオルソログを持たないため、このルールに従わない(ヒトDCDC1およびマウスBAC26042)。 さらに、ほとんどの場合、N末端に位置するDCXドメインは、同じタンパク質のC末端ドメインよりも、他のN末端ドメインと類似していた。 例外はすでに述べた2つで、ヒトDCDC2BとFLJ46154である。 BLATと系統解析を組み合わせた配列解析により、表1に示す相同関係が確認された。

図2

ヒトおよびマウスのDCXドメインタンパク質を含む最尤系統樹(ML)、ブートストラップの値を示す。

次に、いくつかの非哺乳類ゲノムを追加して配列分析を拡張した。 当初は、保存ドメインデータベース CDD で見つかったタンパク質を解析対象とした。 その後、BLAST、TBLASTN、BLATによる広範な検索を行った。 BLAT検索により、フクロネズミ、ラット、アカゲザルの配列が追加された。 Cionaの配列は、ゲノムデータに対してTBLATN解析を行い、ESTに対応する配列のみを追加した。 したがって、今回の系統解析では、ヒト、チンパンジー、マウス、ウシ、イヌ、ニワトリ、魚、ミミズ、昆虫、カエル、真菌、ホヤのDCXモチーフ含有タンパク質を対象とした(補足図3には、マルチプルアラインメントを掲載した)。 タンデムDCXドメインタンパク質(67タンパク質)の解析の結果、図3に示すブートストラップ値の根なし木が得られた。

図3

異なる種からのタンデムDCXドメインタンパク質のMLツリー。 ブートストラップ値を示す。

67個のタンパク質を含むタンデムDCXドメインツリーの中で、4つのタンパク質グループが容易に分類される。 上から順に、RP1とRP1L1のグループには、カエルXenopus laevis、魚(ゼブラフィッシュDanio rerio、フグTetraodon nigrovidis)、鶏、牛、犬、マウス、ラット、チンパンジー、ヒトのオルソログが含まれる。 第二のグループは、フクロネズミを含む哺乳類、ニワトリ、魚、カエル、ホヤのHalocynthia roretzi、ホヤのCiona intestinalisなどの単純な生物から得られるDCDC2A(以前はDCDC2として知られていたが、HUGO遺伝子命名委員会により名称が承認)に似たタンパク質が含まれている。 第3のグループは、哺乳類のタンパク質は含まれていないが、社会性アメーバであるDictyostelium discoideumのタンパク質と、Ciona intestinalisのタンパク質が1つ含まれている。 同様のタンパク質は、ショウジョウバエ、マラリア蚊のAnopheles gambiae、ミツバチのApis melliferaでも同定されている。 さらに、線虫Caenorhabditis elegans (ZYG-8) とCaenorhabditis briggsaeの2つの類似タンパク質がこのグループで検出された。 第4のグループは、DCX、DCLK、DCLK2に最も類似したタンパク質が含まれている。 このグループには、哺乳類、ニワトリ、魚類、そしてCiona intestinalisからの1つのタンパク質が含まれている。 この2つのドメインを持つタンパク質の解析に続いて、N末端とC末端のドメインを持つタンパク質の解析が行われた(補足図4-5)。 N末端ドメインは170個、C末端ドメインは110個解析され、DCXのN末端部分に類似したタンパク質がやや多いことが示唆された。 4つのグループへの大まかな分類は維持されていた。 N末端の系統樹を構成するタンパク質を調べたところ、主にDictyostelium discoideumのタンパク質を含む第3グループ(8名含む)にタンパク質が追加されたことがわかった。 また、このグループには、ハエやミミズ由来のタンパク質も加わっていた。 ミバエのゲノムには5つのDCXタンパク質があり、そのうちの4つはシングルリピートである。 さらに、いくつかの哺乳類タンパク質もこのグループに追加された。 このグループは、N-グループ26名、C-グループ19名に増やされた。 このグループには、マラリア原虫である単細胞生物Plasmodium falciparumからのタンパク質が含まれていた。

C末端の系統樹を構成するタンパク質を調べると、すべてのDCLK3タンパク質を含むグループが検出された。 このグループは全体としてDCX、DCLK、DCLK2とは全く異なるものであることに注目すべきである。 このグループのタンパク質は、哺乳類(ヒト、チンパンジー、ウシ、ラット、オポッサム)だけでなく、ミバエ、ミツバチ、マラリア蚊からも、単一のDCXドメインを含んでいることが判明した。 例外は、このグループを特徴づけるシオナ蛋白質(Sca_10)で、タンデムリピートがある。 DCDC2A と DCDC2B の両方を含むグループもあり、さらに DCDC2B を含むグループもあることから、このサブセットのタンパク質の C 末端ドメインには進化的にあまり保存されていない配列があることが示唆された。 これらの違いを説明する最も簡単な方法は、遺伝子間配列の損失によるものであろう。 エクソン-イントロン境界の解析には、すべての哺乳類種と、非哺乳類の脊椎動物であり、哺乳類に近いので比較が可能であるニワトリが含まれる(表2)。 一般に、イントロン-エクソン境界の位置は高度に保存されている。 場合によっては、追加のエキソンがあっても、DCXドメインの一部であるアミノ酸の長さが変わらないこともある。 DCDC2Cがそうである。ほとんどの生物種は1つのエクソンを持つが、牛のオルソログでは対応するアミノ酸配列が2つのエクソンに分かれている。 しかし、ほとんどの場合、エキソンの欠如はアミノ酸情報の減少を意味する。 例えば、FLJ46154はほとんどの種で3つのエクソンを含むが、マウスやラットの対応する配列では2つのエクソンしかない。 その結果、マウスとラットでは、ヒトFLJ46154のDCXドメインに相当する領域では、1つのDCXドメインしか確認されなかった。 また、この解析により、DCXドメインタンパク質の進化における重要な時点を特定することができた。 現在、哺乳類と鳥類の共通の脊椎動物の祖先は3億1000万年前にさかのぼり、有袋類は約1億8000万年前に主要(胎盤)グループから分かれ、ヒトとネズミは約8700万年前に進化的家系から分かれたとされている。 上記の解析の結果、BAC26042は進化の過程で失われた可能性が高いことがわかった(マウスでは2つのエクソンが存在するが、ラットとアカゲザルは1つのエクソンのみ保有する)。 この解析は、FLJ46154とBAC26042の両方を含む融合配列であるラットでの予測配列(XM_230359)のために複雑になっている。 しかし、我々は、この融合配列の存在を支持しない実験的証拠を得ている。 マウスFLJ46154タンパク質に対して作成した抗体は、マウス脳抽出液中のFLJ46154の予測されるサイズのタンパク質を認識した(補足図6)。 このように、mRNAやESTデータから得られるヒトのデータと、ESTデータから得られるマウスのデータをもとに、我々の実験データに裏付けされた解析が行われました。 DCLK3は哺乳類と鳥類に分かれた後に生成された。 BAC26042、FLJ46154、DCDC2Cは、有袋類が主要胎盤群から分かれた後に作出された。 DCDC1は、ヒトとげっ歯類が分かれた後に生成された。 この解析によると、このスーパーファミリーで最も保存されている遺伝子はDCX、DCLK、DCDC2Aである。

N-とC-ターミナルドメインを含む二つのグループの解析に続いて、すべてのDCXタンパク質について解析を行った(データは示されていない)。 先にヒトとマウスのタンパク質で観察されたように(図2)、N-とC-末端ドメインは、同じタンパク質内の対応するリピートよりも互いに類似していた。 この結果は、DCXドメインの重複は古く、おそらくこれら2つの繰り返しは機能が異なっていることを示唆した。 N末端とC末端のDCXモチーフのサブスペシャリティ化は、ロゴ配列のレベルで可視化することができる。 以前、DCXモチーフ内の4つの保存ブロック(A-D)が同定され、これらの保存ブロックは図4の下段に示されている。 N末端領域とC末端領域を分けて解析したところ、AサブドメインとBサブドメイン、Cサブドメインの一部がN末端を、Cサブドメインの一部がC末端を規定していることが明らかになった(Fig.4)。 この結果は、Lawrence Gibbs samplerのモチーフ探索アルゴリズムを用いて得られたものである。 同様の結果は、SmithのMOTIFモチーフファインディングアルゴリズムでも得られた(データは示していない)。 この分析から、タンデムドメインは類似のアミノ酸の短い配列を共有しているが、N末端ドメインはユニークな非常に保存されたアミノ酸のブロックを有することが示された。 DCXモチーフからのマルチプルアラインメントを配列ロゴとして示す。 各アミノ酸の高さは情報のビットを表し、配列に重み付けをして頻度を予想されるアミノ酸頻度で調整した後、その位置(y軸)での保存性に比例している。 ロゴの下には、内部のA-Dサブドメイン内のアミノ酸の番号付けがされている。 このSeqLogoはLawrence Gibbs samplerモチーフファインディングアルゴリズムを表している。

Expression analysis by in situ hybridization

異なるDCXドメインパラログ間の類似性、およびシグナル伝達と微小管制御に関する共通の機能、を考慮すると、これらの遺伝子はいつ、どこで発現されるかを確立することが重要である。 このことは、これらの遺伝子の潜在的な機能を明らかにするのに役立つであろう。 例えば、ある遺伝子が増殖細胞、遊走細胞、分化細胞のいずれで発現しているかを区別することは、遺伝子の機能を解明する上で非常に重要である。 また、特定の組織での共発現は、パラログが協調しているか冗長である可能性を示しているのかもしれません。 この解析は、発現プロファイルの「スナップショット」を作成することを目的として行われました。 ユビキタスに発現するDcdc2B(図5D)を除いて、DCX-repeatを含むタンパク質をコードする遺伝子の発現パターンは、多かれ少なかれ地域的なものであった。 Dcx、DclkおよびDclk2は、脳、脊髄、頭蓋神経節および後根神経節、副交感神経節を含む中枢および末梢神経系で発現している(図5A-C)。 高倍率図(図5E-H)は、発達中の新皮質ではDcxとDclkの転写物が前板ではるかに多く、しかしDcxとDclk遺伝子を発現する個々の細胞は心室帯で検出されることを示している。 Dclk2とDcdc2Bは共に発達中の新皮質で発現しており、ほぼ均一かつ低レベルであるが、DcxとDclkよりも脳室帯で顕著に発現している。 神経系以外では、DcxとDclkの顕著な発現部位は、骨格筋、舌筋、嗅上皮の個々の細胞である(図5A,B)。 後者の組織ではDclk2も発現している(図5C)。

BAC26042, FLJ46154およびDcdc2Aは高度な領域発現パターンを示し、脳ではBAC26042とFLJ46154で類似しているようだ(図5I-K)。 図5Iおよび5Jは前脳の矢状断面図であり、BAC26042およびFLJ46154の転写物が中隔、腹側視床の様々な細胞群、および視床下部後部に存在していることがわかる。 その他の発現部位としては、嗅球の基部にあるニューロン群(図5I,J)、視蓋前部、顔面核、脊髄の腹側および背側に散在するニューロン(データは示していない)などがある。 CNSにおけるDcdc2Aの発現は、発達中の小脳の最も外側の部分に散在するニューロン群に限定されている(図5K)。 BAC26042とDcdc2Aは脈絡叢で発現している(図5I、K)。

DCX-repeatコード遺伝子の大部分は、発達中の網膜で発現している。 3種類のパターンが出現する。 Dcx、Dclk、Dclk2の転写産物は、後生児期の内側神経芽細胞層に強く発現している(図5L-N)。一方、BAC26042とFLJ46154もこの層に発現するが、その表面付近により限定された形で発現する(図5P,Q)。 最後に、Rp1l1の転写物は、増殖細胞を含む外側の神経芽細胞層で見られる(図5O)。 さらに、肺と腎臓ではDcx、Dclk、Dcdc2Aを発現している。 Dclk2の転写物は発生中の卵巣にも見られ、弱い発現は腎臓全体にも見られる(データは示されていない)。

我々の分析は、表1に記載された11遺伝子のほとんどを含み、例外はDclk3、およびDcdc2Cで、我々はまだ適したテンプレートを特定できないでいた。 Rp1も調べたが、E14.5では脊髄の一部の正中細胞で発現が認められた以外は発現していない(データなし)。 私たちの研究を要約すると、電気刺激に反応する組織(中枢神経系、末梢神経系、骨格筋)が、DCX-repeatをコードする遺伝子の最も顕著な発現部位であることがわかった。 これらの組織以外では、腎臓と肺を除いて、発現はほとんど低く、通常は局所的でない。 そこで、本研究で調査したDCX遺伝子スーパーファミリーのヒトメンバーの発現を、そのマウスオルトログと比較した。 この目的のために、我々は発現データウェブサイトのUnigeneデータベースを使用した。 ヒトおよびマウスのDCXリピート含有タンパク質の組織依存的な発現プロファイルは、UNIGENEから提供されたEST数から作成された。 マウスとヒトの比較が重要な特徴であるため、両生物に共通するESTカウントの総数が多い組織に限定して解析を行った。 ヒトの遺伝子は10種類、マウスの遺伝子は8種類のデータを解析した。 ヒトの2つの遺伝子については、マウスでの対応する発現データがなかった。 DCDC2BはUNIGENEに掲載されていないマウスのオルソログがあり、DCDC1はマウスのオルソログがない。 この解析の結果得られたクラスタ化された発現データを図6Aに、この情報に基づく遺伝子-遺伝子相関を図6Bに示す。

図6

A) Unigene遺伝子-組織発現データのクラスタリング。 B) Unigene発現データに基づく遺伝子間相関。

ランダムパーミュテーション解析により、相関の有意性を検証した。 各遺伝子について独立して全組織をランダムに再サンブルした後、相関を1000回再計算した。 その結果、高い相関(>0.5)はすべて有意であった(p < 0.01)。 また、非常に高い相関を示す2つのクラスターが観察された。 最も大きなグループは、ヒトのRP1、RP1L1、およびそれらのマウスのオルソログを含んでいた。 また、これまで主に精巣や胚性脳で発現していると報告されていたDCDC1もこのグループに含まれていた。 このグループの特徴は、DCXタンパク質の多くに共通する眼球での発現の高さで、in situ解析でも指摘されている。 眼球での発現に加え、これらの遺伝子は他のいくつかの組織でのみ低レベルで発現している。 このグループでは、マウスとヒトでの発現の遺伝子間相関に明確な区別はない。 このグループの異なるメンバー間の相関は、全てのケースで>0.9である。 ヒトとマウスのFLJ46154は共にこのグループに属しているが、ヒトとマウスのFLJ46154の相関は0.3と低い。 また、この2つの遺伝子のタンパク質産物も分岐しており、マウスのタンパク質ではDCXドメインが失われている。

高い遺伝子間相関を示す第二のグループは、マウス遺伝子Dcx、Dclk、Dclk2、およびそれらのヒト正ローグである。 ヒトDCLK2はこのグループの他の遺伝子に比べ、マウスのオルソログとの相関がやや低い(0.4)。 これは、その全体的な発現レベルが低いことに由来すると考えられる(図6A)。 また、我々のin situデータは、Dcx、Dclk、Dclk2の共発現に高い類似性があることを示していた。 さらに、機能解析の結果、このグループはより多くの特性を共有しており、唯一、足場タンパク質であるneurabin 2と相互作用することが示された。 相関の低い第3の遺伝子グループには、DCDC2A、DCLK3、Dcdc2A、およびDclk3が含まれた。 このグループでは、対応するオルソログ間の相関は0.5を超えない。 例えば、DCLK3とFlj46154、FLJ46154とDCX、DCLK、Dcxのように、異なる遺伝子間でさらに高い相関があることに注意する必要がある

コメントを残す

メールアドレスが公開されることはありません。