Identification of proteins with a DCX domain
A humán és egér proteomokban a humán DCX doménhez hasonló szekvenciákat kerestünk, összesen 22 fehérjét találtunk, amelyek egy vagy két DCX ismétlődést tartalmaznak (1. táblázat, a jelen tanulmányban használt teljes szekvenciák a kiegészítő ábrán találhatók. 1. ábra).
Serin/treonin protein kináz doméneket találtunk három humán/egér fehérjében (DCLK, DCLK2 és DCLK3), és egy szénhidrátok kötésére jósolt ricin domént találtunk egy FLJ46154 nevű humán/egér fehérjében. A humán FLJ46154 és DCDC2B fehérjék szerkezete különbözött más, tandem ismétlődéseket tartalmazó fehérjékétől; egy, a DCX C-terminális ismétlődéséhez jobban hasonlító ismétlődést tartalmaztak, amely e fehérje N-terminális részében jelent meg, és egy második, a DCX N-terminális ismétlődéséhez jobban hasonlító ismétlődést. E két fehérje egér ortológjaiban csak egy DCX-domén volt jelen. Az egérgének mindegyike olyan kromoszómarégiókban található (1b. ábra), amelyek a humán ortológokkal szintetikusak (2. kiegészítő ábra). Ide tartozik a DCDC1 és a BAC26042 lokalizációja is, azonban ezek nem valódi ortológok, mivel a szekvencia-hasonlóság csak a DCX-doménben nagyon alacsony (52%, a 86 aminosavból 46 között), és az alább ismertetett filogenetikai és evolúciós elemzés azt mutatja, hogy különböznek egymástól. A BAC26042 az FLJ46154-hez való szoros fizikai közelségében is egyedülálló, a két gén közötti távolság mindössze 2 kb, ami arra utal, hogy közös szabályozási elemeik lehetnek.
Ez a tanulmány a DCX-doménekre koncentrál, és nem terjed ki a teljes hosszúságú fehérjékre. Filogenetikai elemzést végeztünk az egyes DCX-doménekre, elkülönítve az N- és C-terminális részeket (2. ábra). A humán és egér DCX-domén filogenetikai elemzéséből több érdekes jellegzetesség is kiderült. A humán gének többségének volt egér ortológja. Két gén nem engedelmeskedett ennek a szabálynak, mivel nem rendelkeztek egyértelmű ortológokkal (humán DCDC1 és egér BAC26042). Továbbá a legtöbb esetben az N-terminálisan elhelyezkedő DCX-domének jobban hasonlítottak más N-terminális doménekhez, mint ugyanazon fehérje C-terminális doménjeihez. A két kivételt már említettük; a humán DCDC2B és az FLJ46154. A BLAT és a filogenetikai elemzést kombináló szekvenciaelemzés az 1. táblázatban felsorolt ortológ kapcsolatokat azonosította.
A következőkben a szekvenciaelemzést több további nem emlős genommal bővítettük. Kezdetben az elemzés a CDD konzervált domén adatbázisban található fehérjékre terjedt ki. Ezt követően ezeket a kereséseket kiterjedt BLAST, TBLASTN és BLAT keresésekkel bővítettük. A BLAT keresés segítségével oposszumból, patkányból és rhesusmajomból származó szekvenciákat adtak hozzá. A Ciona-szekvenciákat a genomi adatokkal végzett TBLATN-elemzéssel adtuk hozzá, és csak az EST-eknek megfelelő szekvenciákat vettük fel. Így a jelen filogenetikai elemzésbe a DCX-motívumot tartalmazó fehérjéket emberből, csimpánzból, egérből, tehénből, kutyából, csirkéből, halakból, férgekből, rovarokból, békákból, gombákból és tengeri csigákból is bevontuk (a többszörös illesztések a 3. kiegészítő ábrán találhatók). A tandem DCX-domén fehérjék (67 fehérje) elemzése a 3. ábrán látható bootstrap értékekkel gyökértelen fát eredményezett.
A 67 fehérjét tartalmazó tandem DCX-domén fán belül a fehérjék négy csoportja könnyen kategorizálható. Fentről lefelé haladva az RP1 és RP1L1 csoportba tartoznak a béka Xenopus laevis, a halak (zebrahal Danio rerio és gömbhal Tetraodon nigrovidis), a csirke, a tehén, a kutya, az egér, a patkány, a csimpánz és az ember ortológjai. A második csoportba a DCDC2A-hoz (korábban DCDC2 néven ismert, a HUGO génnómenklatúra-bizottság által jóváhagyott név) hasonló fehérjék tartoznak emlősökből, beleértve az oposszumot (erszényes állat), valamint csirkéből, halból, békából és egyszerűbb szervezetekből, például az ascidia Halocynthia roretzi és a Ciona intestinalis tengeri csigából. A fehérjék harmadik csoportja nem tartalmaz emlős fehérjéket, de tartalmaz fehérjéket a Dictyostelium discoideum társas amőbából és egy fehérjét a Ciona intestinalisból. Hasonló fehérjéket azonosítottak a gyümölcslégyben, a Drosophila melanogasterben, a maláriaszúnyogban, az Anopheles gambiae-ben és a mézelő méhben, az Apis melliferában. Továbbá a Caenorhabditis elegans (ZYG-8) és a Caenorhabditis briggsae férgek két hasonló fehérjét is kimutatták ebben a csoportban. A fehérjék negyedik csoportjába a DCX-hez, a DCLK-hoz és a DCLK2-höz leginkább hasonló fehérjék tartoznak. Ebbe a csoportba emlős-, csirke- és halfehérjék, valamint egy Ciona intestinalisból és Ciona intestinalisból származó fehérje került. A két doménnel rendelkező fehérjék elemzését az N- és C-terminális doménnel rendelkező fehérjék elemzése követte (4-5. kiegészítő ábra). Az N-csoportban százhét fehérjét, a C-csoportban pedig százegy fehérjét elemeztünk, ami arra utal, hogy a DCX N-terminális részéhez valamivel több fehérje hasonlít. A négy csoportra való általános felosztás megmaradt. Az N-terminális filogenetikai fát alkotó fehérjék vizsgálata azt mutatta ki, hogy további fehérjék főként a Dictyostelium discoideum fehérjét tartalmazó harmadik csoportba (amely 8 tagot tartalmaz) kerültek. A legyekből és férgekből származó fehérjéket is hozzáadták ehhez a csoporthoz. A gyümölcslégy genomja öt DCX fehérjét tartalmaz, amelyek közül négy egyszeres ismétlődésű. Ezenkívül számos emlős fehérjét is felvettek ebbe a csoportba. Ez a csoport 26 tagot tartalmaz az N-csoportban és 19 tagot a C-csoportban. Ebbe a csoportba tartozott a Plasmodium falciparum egysejtű organizmusból, a malária parazitából származó fehérje is.
A C-terminális filogenetikai fát alkotó fehérjéket vizsgálva egy olyan csoportot fedeztek fel, amely az összes DCLK3 fehérjét tartalmazza. Meg kell jegyezni, hogy ez a csoport egészében meglehetősen különbözik a DCX, DCLK és DCLK2 fehérjéktől. Az ebbe a csoportba tartozó fehérjék egyetlen DCX-domént tartalmaznak emlősökből (ember, csimpánz, tehén, patkány és oposszum), de gyümölcslegyekből, méhekből és maláriaszúnyogokból is. Kivételt képez az ezt a csoportot jelölő cionafehérje (Sca_10), amely egy tandem ismétlődést tartalmaz. Az egyik csoport DCDC2A és DCDC2B fehérjéket is tartalmaz, egy másik csoport pedig még több DCDC2B fehérjét, ami valószínűleg kevésbé evolúciósan konzervált szekvenciákra utal a fehérjék ezen alcsoportjának C-terminális doménjeiben.
A DCX-domén fehérjék elemzése során a megfelelő ortológokban tandem vagy szimpla DCX-domének jelenlétét figyelték meg. Ezeket a különbségeket legegyszerűbben az intergenikus szekvenciák elvesztésével magyarázhatjuk. Az exon-intron határok elemzése az összes emlős fajra és a csirkére is kiterjedt, mivel ez egy nem emlős gerinces, amely elég közel áll az emlősökhöz ahhoz, hogy az összehasonlítás lehetséges legyen (2. táblázat). Általánosságban elmondható, hogy az intron-exon határok elhelyezkedése nagymértékben konzervált. Néhány esetben egy további exon jelenléte nem változtatja meg a DCX-domének részét képező aminosavak hosszát. Ez a helyzet a DCDC2C esetében; a legtöbb faj egy exont tartalmaz, míg a tehén ortológja a megfelelő aminosav szekvenciát két exonra osztja. A legtöbb esetben azonban az exon hiánya az aminosav-információ csökkenésével jár. Például az FLJ46154 a legtöbb fajban három exont tartalmaz, míg az egérben és a patkány megfelelő szekvenciájában csak kettőt. Következésképpen egérben és patkányban csak egyetlen DCX-domént azonosítottak a humán FLJ46154 DCX-doméneknek megfelelő régióban. Ez az elemzés lehetővé teszi a DCX-domén fehérjék evolúciójának kulcsfontosságú időpontjainak azonosítását is. Az emlősök és a madarak közös gerinces őse ma már 310 millió évre nyúlik vissza, az erszényesek körülbelül 180 millió évvel ezelőtt váltak le a fő (placenta) csoportról, az ember és a rágcsálók pedig körülbelül 87 millió évvel ezelőtt váltak le az evolúciós családfáról. A fenti elemzésből kiderült, hogy a BAC26042 valószínűleg elveszett az evolúció során (az egérben két exon létezik, míg a patkányban és a rhesusmajomban csak egy exon található). Ezt az elemzést megnehezítette egy patkányban található prediktált szekvencia (XM_230359), amely egy olyan fuzionált szekvencia, amely az FLJ46154-et és a BAC26042-t is tartalmazza. Kísérleti bizonyítékokkal rendelkezünk azonban, amelyek nem támasztják alá ennek a fuzionált szekvenciának a létezését. Az egér FLJ46154 fehérje ellen előállított antitestek az egér agyi kivonatban az FLJ46154-nek megfelelő méretű fehérjét ismerik fel (6. kiegészítő ábra). Elemzésünket tehát az mRNS- és EST-adatokból származó humán adatok, valamint az EST-adatokon alapuló egér adatok alapján végeztük, amelyeket kísérleti adatainkkal támasztunk alá. A DCLK3 az emlősök és a madarak szétválása után keletkezett. A BAC26042, FLJ46154 és DCDC2C azután keletkezett, hogy az erszényesek leváltak a fő placentacsoportról. A DCDC1 az ember és a rágcsáló szétválása után keletkezett. Az elemzés szerint a szupercsalád legkonzerváltabb génjei a DCX, a DCLK és a DCDC2A.
A két csoport N- és C-terminális doméneket is tartalmazó elemzését követően az összes DCX-fehérje elemzésére sor került (az adatok nem láthatóak). Ahogy korábban a humán és egér fehérjék esetében megfigyeltük (2. ábra), az N- és C-terminális domének jobban hasonlítottak egymáshoz, mint az azonos fehérjén belüli megfelelő ismétlődéshez. Ez az eredmény arra utalt, hogy a DCX-domén duplikációk ősiek voltak, és valószínűleg ez a két ismétlődés különbözött a funkciójukban. Az N-terminális és C-terminális DCX-motívumok szubspecializációja a logoszekvenciák szintjén láthatóvá tehető. Korábban négy konzervált blokkot (A-D) azonosítottak a DCX-motívumon belül , ezek a konzervált blokkok a 4. ábra alján láthatók. Amikor az N-terminális régiót a C-terminális régiótól elkülönítve elemeztük, nyilvánvalóvá vált, hogy az A és a B- és C- szubdomének egy része az N-terminális régiót, míg a C- szubdomén egy része a C-terminális régiót specifikálja (4. ábra). Ezt az eredményt a Lawrence Gibbs sampler motívumkereső algoritmus segítségével kaptuk. Hasonló eredményt kaptunk a Smith-féle MOTIF motívumkereső algoritmussal is (az adatok nem láthatóak). Ez az elemzés azt jelzi, hogy bár a tandemdomének hasonló aminosavak rövid szekvenciáján osztoznak, az N-terminális doménnek van egy egyedi, nagyon konzervált aminosavblokkja.
Expressziós elemzés in situ hibridizációval
A különböző DCX domén paralógok közötti hasonlóságokat, valamint a jelátvitelhez és a mikrotubulus szabályozáshoz kapcsolódó közös funkcióikat figyelembe véve , fontos megállapítani, hogy ezek a gének mikor és hol expresszálódnak. Ez segíteni fog potenciális funkciójuk körülhatárolásában. Például annak megkülönböztetése, hogy egy adott gén proliferáló, migráló vagy differenciálódó sejtekben fejeződik-e ki, kritikus fontosságú, amikor a gén funkcióját próbáljuk kitalálni. Továbbá, a koexpresszió egy adott szövetben azt jelezheti, hogy a paralógok együttműködhetnek vagy redundánsak lehetnek.
Az elemzésünket in situ hibridizációval végeztük E14,5-ben, egy olyan stádiumban, amikor már számos, a felnőtt szervezetre jellemző differenciált sejttípus kialakult, ugyanakkor az ilyen, a terhesség közepén lévő embrionális szövetek még tartalmaznak progenitor sejteket. Ezt az elemzést azzal a céllal végeztük, hogy egy expressziós profil “pillanatfelvételt” készítsünk. Az ubiquitikusan expresszálódó Dcdc2B kivételével (5D ábra) a DCX-repeat-tartalmú fehérjéket kódoló gének expressziós mintázatai kisebb-nagyobb mértékben regionálisak. A Dcx, Dclk és Dclk2 a központi és a perifériás idegrendszerben expresszálódik, beleértve az agyat, a gerincvelőt, a koponya- és a háti gyökérganglionokat, valamint a paraszimpatikus ganglionokat (5A-C ábra). Nagy teljesítményű felvételen (5E-H ábra) látható, hogy a fejlődő neocortexben a Dcx és Dclk transzkriptumok sokkal nagyobb mennyiségben fordulnak elő a preplateumban, de a kamrai zónában is kimutathatók a Dcx és Dclk géneket expresszáló egyes sejtek. A Dclk2 és a Dcdc2B is kifejeződik a fejlődő neocortexben, nagyrészt egységesen és alacsony szinten, de a kamrai zónában kifejezettebben, mint a Dcx és a Dclk. Az idegrendszeren kívül a Dcx és a Dclk expressziójának kiemelkedő helyei a vázizmok, a nyelvizmok és a szaglóhám egyes sejtjei (5A,B ábra). Ez utóbbi szövet a Dclk2-t is expresszálja (5C. ábra).
A BAC26042, az FLJ46154 és a Dcdc2A erősen regionális expressziós mintázatot mutat, amely az agyban a BAC26042 és az FLJ46154 esetében hasonlónak tűnik (5I-K. ábra). Az 5I. és 5J. ábra az előagy szagittális metszeteit mutatja, amelyeken a BAC26042 és FLJ46154 transzkriptumok a szeptumban, a ventrális talamusz különböző sejtcsoportjaiban és a hátsó hipotalamuszban vannak jelen. További expressziós helyek a szaglógumó tövében lévő neuroncsoport (5I,J ábra), a pretectalis terület, az arcmag, valamint a gerincvelő ventrális és dorzális részein elszórtan elhelyezkedő neuronok (az adatok nem láthatóak). A Dcdc2A expressziója a CNS-ben a fejlődő kisagy legkülső részén elszórtan elhelyezkedő neuronok egy csoportjára korlátozódik (5K. ábra). A BAC26042 és a Dcdc2A a chorioidea plexiben expresszálódik (5I,K ábra).
A DCX-ismétlődést kódoló gének többsége a fejlődő retinában expresszálódik. Háromféle mintázat rajzolódik ki: A Dcx, Dclk, Dclk2 transzkriptumok erősen kifejeződnek a posztmitotikus belső neuroblastikus rétegben (5L-N ábra), míg a BAC26042 és FLJ46154 szintén kifejeződik ebben a rétegben, de korlátozottabb módon a felszín közelében és annak felszínén (5P,Q ábra). Végül az Rp1l1 transzkriptumok a proliferáló sejteket tartalmazó külső neuroblastikus rétegben találhatók (5O. ábra). A külső neuroblastikus rétegben sugárirányban elhelyezkedő Dcx, Dclk vagy Dclk2-expresszáló sejtek mutathatók ki, ami emlékeztet a neokortex kamrai zónájában megfigyelhető helyzetre (5E-G. ábra).
A tüdő és a vese emellett Dcx, Dclk és Dcdc2A expressziót is tartalmaz. A Dclk2 transzkriptumai a fejlődő petefészekben is megtalálhatók, és gyenge expresszió figyelhető meg az egész vesében is (az adatok nem láthatóak).
Az elemzésünk az 1. táblázatban felsorolt 11 gén többségére kiterjedt, a kivételek a Dclk3, és a Dcdc2C, amelyekhez még nem tudtunk megfelelő sablonokat azonosítani. Az Rp1-et is megvizsgáltuk, de E14,5-ben nem expresszálódik, kivéve a gerincvelő néhány középvonalbeli sejtjében észlelt expressziót (az adatok nem láthatóak). Összefoglalva vizsgálatainkat, azt találtuk, hogy az elektromos ingerekre való válaszadásra rendelt szövetek – a központi és a perifériás idegrendszer és a vázizmok – jelentik a DCX-repeat kódoló gének expressziójának legszembetűnőbb helyeit. Ezeken a szöveteken kívül az expresszió többnyire alacsony és általában nem regionális, a kivételek a vese és a tüdő.
Expressziós analízis emberen és egéren
A funkcionális genomikai megközelítések egérmodelleken alapuló relevanciája a humán betegségek tanulmányozásában nyilvánvalóan a két faj génexpressziójának hasonlóságától függ. Ezért összehasonlítottuk a DCX génszupercsalád e tanulmányban vizsgált humán tagjainak expresszióját egér ortológjaikkal. Ehhez az Unigene expressziós adatokat tartalmazó weboldal adatbázisát használtuk. Mind a humán, mind az egér DCX ismétlődést tartalmazó fehérjék szövetfüggő expressziós profiljait az UNIGENE által biztosított EST-szám alapján hoztuk létre. Mivel az egér-ember összehasonlítás volt a fő jellemző, az elemzést azokra a szövetekre korlátoztuk, amelyekben magas volt az EST-szám, és amelyek mindkét szervezetben közösek voltak. Tíz különböző emberi gén és nyolc egér gén adatait elemeztük. Két humán gén esetében nem állt rendelkezésre megfelelő egér expressziós adat: A DCDC2B, amelynek egér ortológja nem szerepel az UNIGENE-ben, és a DCDC1, amelynek nincs egér ortológja. Az ebből az elemzésből származó klaszterezett expressziós adatok a 6A. ábrán, az ezeken az információkon alapuló gén-gén korreláció pedig a 6B. ábrán látható.
A korreláció szignifikanciáját random permuation analízissel teszteltük. A korrelációkat 1000-szer újraszámoltuk, miután minden gén esetében függetlenül minden szövetet véletlenszerűen újraszelekcióztunk. Azt találtuk, hogy minden magas korreláció (>0,5) szignifikáns volt (p < 0,01). Két nagyon magas korrelációt mutató klasztert figyeltünk meg. A legnagyobb csoportba a humán RP1 és RP1L1, valamint ezek egér ortológjai tartoztak. Ezenkívül a DCDC1, amelyről eddig azt jelentették, hogy főként a herében és az embrionális agyban fejeződik ki, ebbe a csoportba tartozott. Ezt a csoportot a szemen belüli magas szintű expresszió jellemzi, ami a legtöbb DCX-fehérje esetében közös, és az in situ elemzésünkben is megfigyeltük. A szembeli expresszió mellett ezek a gének csak néhány más szövetben fejeződnek ki alacsonyabb szinten. Ebben a csoportban nincs egyértelmű különbség a gén-gén korrelációban az egér és a humán expresszióban. A csoport különböző tagjai közötti korreláció minden esetben >0,9. Az emberi és az egér FLJ46154 is ehhez a csoporthoz tartozik, azonban az emberi és az egér FLJ46154 közötti korreláció alacsony (0,3). E két gén fehérjetermékei is eltértek egymástól, az egér fehérjéből hiányzik egy DCX-domén. Így lehetséges, hogy ezeknek a géneknek a szabályozó régióiban is kisebb a konzerváltság.
A második magas gén-gén korrelációt mutató csoportba az egér Dcx, Dclk és Dclk2 gének és humán ortológjaik tartoznak. A humán DCLK2 valamivel alacsonyabb korrelációt mutatott egér ortológjával (0,4), mint a csoport többi génje. Ez az általános, alacsonyabb általános expressziós szintjéből eredhet (6A. ábra). Az in situ adataink a Dcx, a Dclk és a Dclk2 koexpressziójában is nagyfokú hasonlóságot jeleztek. Továbbá funkcionális elemzésünk azt jelezte, hogy ez a csoport több közös tulajdonsággal rendelkezik, és csak ők lépnek kölcsönhatásba a neurabin 2 nevű állványfehérjével. A harmadik, alacsonyabb korrelációs szintet mutató géncsoport a DCDC2A, DCLK3, Dcdc2A és Dclk3. Ebben a csoportban a megfelelő ortológok közötti korreláció nem haladja meg a 0,5-öt. Meg kell jegyezni, hogy van néhány további magas korreláció a különböző gének között, például; DCLK3 és Flj46154, vagy FLJ46154 a DCX-szel, DCLK-val és Dcx-szel.