Draft genome sequences of Hirudo medicinalis and salivary transcriptome of three close related medicinal leeches

Genome assembly and annotation

Aby złożyć genom H. medicinalis, wyodrębniliśmy DNA z dorosłej pijawki. Przed obróbką, pijawka była utrzymywana bez karmienia przez co najmniej 2 miesiące. Stworzyliśmy zestaw trzech bibliotek shotgun, aby przeprowadzić sekwencjonowanie przy użyciu trzech różnych platform (Tabela 1). Wszystkie zestawy danych odczytów zostały połączone, a pojedyncze złożenie zostało utworzone przez SPAdes . Wynikowa asemblacja zawierała 168 624 kontigów o długości N50 kontigów 12,9 kb (Tabela 2).

Wstępna analiza (contigs BlastN) ujawniła obecność sekwencji bakteryjnych w wynikowej asemblacji. W związku z tym przeprowadziliśmy binning w celu dyskryminacji kontigów pijawkowych (a leech bin). Zbudowaliśmy rozkład kontigów według ich obfitości GC, częstotliwości tetranukleotydów i pokrycia odczytów. Aby zwiększyć dokładność binningu, zasięg odczytu został określony przez połączenie odczytów DNA z odczytami odpowiadającymi połączonemu transkryptomowi H. medicinalis (patrz niżej). Rozróżnienie kontigów eukariotycznych i prokariotycznych jest zilustrowane na Rys. 1a/b, w Tabeli 3 i Danych Dodatkowych 2. Dodatkowo, wybraliśmy kontigi mitochondrialne w celu złożenia genomu mitochondrialnego pijawki .

Fig. 1
figure1

The H. medicinalis genome binning. a. 2D-plot pokazujący rozkład kontigów we współrzędnych zawartości GC i pokrycia przez kombinację odczytów uzyskanych przez Ion Proton i Illumina. Kontigi zaznaczone są kropkami, a przynależność taksonomiczna kontigów na poziomie domen zakodowana jest kolorem (zielony – Bacteria, niebieski – Eukarya, czarny – brak przypisania). Przynależność taksonomiczna została określona przez bezpośrednie przeszukiwanie bazy danych nt National Center for Biotechnology Information (NCBI) metodą BlastN (megablast). Wykres 3D przedstawiający rozkład kontigów we współrzędnych zawartości GC, pokrycie odczytami (Proton i Illumina) oraz pokrycie odczytami cDNA gospodarza jest przedstawiony w Supplementary Data 2. bGenom H. medicinalis zawiera klastry genów związanych z mączniakiem krwionośnym. Wykres przedstawia strukturę eksonowo-intronową genów i rozmieszczenie klastrów genów w rusztowaniach w skali ogólnej. Strzałki eksonów wskazują kierunek transkrypcji (szary – gen nieznany)

Kontygeny eukariotyczne poddano procedurze scaffoldingu z wykorzystaniem sparowanych odczytów. Rusztowania zostały wygenerowane przy użyciu zestawów danych Illumina paired-end i mate-pair read przez SSPACE . Po rusztowaniu złożenie składało się z 14,042 sekwencji o długości N50 rusztowania 98 kb (tabele uzupełniające 4 i 5). Długość genomu pijawki lekarskiej szacuje się na 220-225 Mb. Całkowita długość zmontowanego szkicu genomu wynosi 187,5 Mbp, co odpowiada 85% teoretycznego rozmiaru genomu pijawki (patrz Tabela 6). Łącznie przewidziano 14 596 genów kodujących białka.

Zidentyfikowaliśmy również nowe homologi genów kodujących znane antykoagulanty lub białka związane z mączką krwionośną. W oparciu o dane dotyczące sekwencji genomu i wykorzystując znane sekwencje białek, określiliśmy organizację tych genów (Tabela uzupełniająca 7, Ryc. 1b). Pozycje i długości eksonów i intronów zostały przewidziane przy użyciu odpowiednich sekwencji cDNA i białek jako referencji. W niektórych przypadkach geny są zlokalizowane we wspólnych rusztowaniach i tworzą tandemy lub klastry Ryc. 1b.

mRNA-seq, montaż transkryptomu i anotacja

Aby uzyskać tkankowo-specyficzne próbki mRNA od trzech gatunków pijawek lekarskich, H. medicinalis, H. verbаna i H. orientalis, wyizolowaliśmy komórki ślinianek i mięśni z kriosekcji przednich części ciała za pomocą mikrodysekcji laserowej (Ryc. 2a). Następnie skonstruowaliśmy dwie biblioteki cDNA z normalizacją i bez normalizacji dla każdej próbki mRNA używając primera oligo-dT i sekwencjonowaliśmy je na Ion Torrent PGM (Tabela 8). Cztery zestawy odczytów odpowiadające skonstruowanym bibliotekom cDNA zostały użyte do złożenia de novo połączonego transkryptomu dla każdego gatunku pijawki lekarskiej przy użyciu Trinity RNA assembler (Tabela 9). Połączone transkryptomy wykorzystaliśmy do mapowania nienormalizowanych odczytów specyficznych dla danej tkanki. Mapowanie odczytów było niezbędne do przeprowadzenia kolejnych analiz ekspresji różnicowej.

Rys. 2
figure2

Analiza ekspresji różnicowej komórek ślinianek. (a) Izolacja komórek ślinianek i mięśni przez mikrodyssekcję laserową. Wykresy MA różnie wyrażonych genów w komórkach ślinowych i mięśniach H. medicinalis dla transkryptomu zmontowanego de novo (b) i modelu genomu (c). Wykresy MA przedstawiają logiczną zmianę fałdową (logFC) względem log-średniej log CPM dla każdego klastra transkryptów w każdej parze porównywanych próbek (mięśnie i komórki ślinowe). Różnicowo wyrażone klastry wspierane przez FDR < 0,05 są wykreślone na czerwono

Analizę ontologii genów (GO) wykrytych transkryptów przeprowadzono przy użyciu Blast2GO i BlastX. Baza danych 'nr’ posłużyła jako baza referencyjna. Analiza GO wykazała, że wszystkie trzy gatunki pijawek lekarskich miały podobną dystrybucję transkryptów w różnych kategoriach GO (Supplementary Figure 3). Rozkład taksonomiczny najbliższych trafień BlastX również był podobny (Supplementary Figure 4). Stwierdzono, że większość zidentyfikowanych transkryptów pasuje do dwóch gatunków Annelida: 59,8% do H. robusta i 10,7% do C. teleta. Analiza ta potwierdziła również brak kontaminacji transkryptami nielekowymi.

Przewidywanie regionów kodujących (lub otwartych ramek odczytu, ORFs) i anotacja danych transkryptomicznych zostały przeprowadzone przy użyciu Transdecoder i Trinotate. ORFy zostały przetłumaczone przy użyciu algorytmu BlastP, a sekwencje białkowe zostały przypisane przez klasyfikację EuKaryotic Orthologous Groups (KOG) przy użyciu bazy danych eggNOG (Supplementary Figure 5). Klasyfikacja KOG ujawniła, że wszystkie trzy gatunki pijawek lekarskich mają podobną dystrybucję transkryptów w kategoriach KOG. Stwierdzono również, że wszystkie trzy gatunki pijawek lekarskich dzielą zdecydowaną większość swoich ortologicznych klastrów (Supplementary Figure 6).

Analiza ekspresji różnicowej

Aby oszacować względne poziomy ekspresji transkryptów zidentyfikowanych w komórkach ślinowych i mięśniach oraz zidentyfikować transkrypty unikalne dla komórek ślinowych, zmapowaliśmy specyficzne tkankowo odczyty cDNA bez normalizacji względem połączonego transkryptomu każdego gatunku pijawki lekarskiej. Odczyty cDNA specyficzne dla tkanek H. medicinalis mapowaliśmy również w stosunku do zespołu genomu tego gatunku. Różnicowo wyrażone geny zostały wykryte zgodnie z niedawno opracowanym protokołem. W celu identyfikacji genów, które ulegają różnej ekspresji w komórkach ślinowych i mięśniach, dla każdego gatunku pijawki lekarskiej skonstruowano indywidualny wykres MA, wykorzystując jego połączony transkryptom (Rys. 2b, Supplementary Figure 7). Dodatkowy wykres MA został skonstruowany dla H. medicinalis z wykorzystaniem jego genomu (Rys. 2c). Geny z q-value (FDR) < 0.05 uznano za różnie wyrażone.

Zidentyfikowaliśmy 102, 174 i 72 różnie wyrażone transkrypty w komórkach ślinianek H. medicinalis, H. orientalis i H. verbana, odpowiednio. Ponieważ te trzy gatunki są blisko spokrewnione z pijawkami lekarskimi, sekwencje białkowe różnie wyrażonych transkryptów zostały pogrupowane w ortologiczne klastry, aby uprościć późniejszą analizę funkcjonalną. Zidentyfikowaliśmy 25 różnie wyrażonych, ortologicznych klastrów wspólnych dla trzech gatunków pijawek i 44 ortologicznych klastrów wspólnych dla co najmniej dwóch gatunków pijawek (Rys. 3, Tabele uzupełniające 10-11). Większość sekwencji w zidentyfikowanych klastrach ortologicznych odpowiada hipotetycznym białkom anotowanym w genomie H. robusta. Analiza konserwowanych domen w zidentyfikowanych klastrach ortologicznych pozwoliła na określenie sekwencji należących do znanych rodzin białek.

Ryc. 3
figure3

Podsumowanie zidentyfikowanych komponentów SCS. Diagramy Venna w górnym panelu pokazują liczbę klastrów ortologicznych zidentyfikowanych przez analizy różnicowej ekspresji (DE) i proteomiczne (Prot) w trzech gatunkach pijawek lekarskich. Histogram w środkowym panelu przedstawia liczbę ortologicznych klastrów zidentyfikowanych przez analizę ekspresji różnicowej, analizę proteomiczną lub ich kombinację (DE + Prot). Każdy słupek zawiera klastry ortologów zidentyfikowanych jako znane składniki związane z odżywianiem się krwią (identified), inne znane białka (other) i nieznane białka (NA). Wykresy kołowe w dolnym panelu ilustrują obfitość poszczególnych komponentów SCS zidentyfikowanych przez analizę ekspresji różnicowej, analizę proteomiczną lub ich kombinację. Szczegóły, patrz Tabele uzupełniające 10, 11, i 13

Przeanalizowaliśmy również różnie wyrażone geny H. medicinalis używając jego zespołu genomowego. Odczyty cDNA dla komórek ślinowych, mięśni i tkanki nerwowej (odczyty uzyskano z Sequence Read Archive (SRA)) zostały zmapowane na zespół genomu. Dla tkanki nerwowej użyliśmy zestawu odczytów dla zwoju 2 ze względu na jego lokalizację w segmentach przedoczodołowych. Analiza ekspresji różnicowej zidentyfikowała 42 geny unikalne dla komórek ślinowych H. medicinalis (Tabela uzupełniająca 12).

Proteomika wydzielania komórek ślinowych

Do analizy proteomicznej, zebraliśmy SCSs od trzech gatunków pijawek lekarskich, H. medicinalis, H. orientalis, i H. verbana, które były utrzymywane bez karmienia przez co najmniej 2 miesiące. SCS zostały pobrane zgodnie z wcześniej opisaną metodą z pewnymi modyfikacjami (patrz Metody).

Metoda przygotowania próbki jest krytyczna dla wynikowego repertuaru zidentyfikowanych białek, ponieważ SCS składa się zarówno z komponentów o niskiej jak i wysokiej masie cząsteczkowej i zawiera inhibitory proteinaz, kompleksy glikoproteinowe i lipidy. Te ostatnie mogą tworzyć kompleksy z białkami. Dlatego też połączyliśmy kilka metod przygotowania próbek i kilka technik spektrometrii mas, aby pokryć jak najszerszy repertuar białek SCS. Proteomiczne zestawy danych uzyskane za pomocą różnych metod przygotowania próbek i technik spektrometrii masowej zostały połączone w celu stworzenia ostatecznej listy zidentyfikowanych białek dla każdego gatunku pijawki lekarskiej.

Zidentyfikowaliśmy 189, 86, 344 białka w SCS odpowiednio H. medicinalis, H. orientalis i H. verbana i pogrupowaliśmy je w ortologiczne klastry, jak opisano powyżej. Stwierdzono, że wszystkie trzy gatunki pijawek lekarskich dzielą 39 ortologicznych klastrów, a 50 ortologicznych klastrów było wspólnych dla co najmniej dwóch gatunków (ryc. 3, tabela uzupełniająca 13). Połączenie danych transkryptomicznych i proteomicznych ujawniło 25 ortologicznych klastrów genów ulegających ekspresji w sposób unikalny w komórkach ślinianek (Supplementary Table 11). Lista poszczególnych komponentów SCS pijawki jest przedstawiona na ryc. 3. Co zaskakuj±ce, geny koduj±ce znane antykoagulanty SCS i białka zwi±zane z posiłkiem krwi nie wykazały zróżnicowanej ekspresji pomiędzy komórkami ¶linianek i mię¶ni. Aby potwierdzić to odkrycie, zbadaliśmy ekspresję saratyny, egliny C, bdelliny, hirustazyny, destabilizatora, inhibitora metalokarboksypeptydazy, apyrazy i enzymu konwertującego angiotensynę (ACE) metodą PCR w czasie rzeczywistym dodatkowych, niezależnych tkankowo specyficznych bibliotek cDNA skonstruowanych dla komórek ślinianek i mięśni. Wyniki real-time PCR dla hirudyny i destabilazy (Supplementary Figure 8) potwierdziły to odkrycie. Wskazuje to, że geny kodujące antykoagulanty i białka związane z posiłkami krwi są zaangażowane nie tylko w odżywianie krwią, ale przyczyniają się do innych, jeszcze nieznanych funkcji fizjologicznych.

Poniżej charakteryzujemy składniki SCS sklasyfikowane w grupy funkcjonalne i opisujemy ich możliwe role w hemostazie. Sekwencje białek i ich wyrównanie przedstawiono na rycinach uzupełniających 9-24.

Enzymy

Proteazy

Wyniki tego badania wskazują, że metaloproteazy z rodzin М12, M13 i M28 są głównymi składnikami enzymatycznymi SCS. Peptydazy M12B (ADAM/reprolizyna) są dużą rodziną metaloproteinaz typu dezintegrynowego, które mają szeroki zakres funkcji i są zaangażowane w wiele procesów fizjologicznych. Enzymy te często występują w jadach węży, a ich transkrypty obserwuje się w sialotranskryptomach różnych gatunków hematofagów. W hemostazie wydzielane proteazy z rodziny М12 mogą uczestniczyć w hamowaniu adhezji płytek krwi oraz w zmiękczaniu skrzepu w wyniku degradacji fibrynogenu. Białka te wykazują zależną od metali aktywność proteolityczną wobec białek macierzy zewnątrzkomórkowej (żelatyna, fibrynogen, fibronektyna), wpływając w ten sposób na regulację zapalenia i odpowiedzi immunologicznej.

U ssaków proteazy z rodziny M13 biorą udział w tworzeniu i rozwoju układu sercowo-naczyniowego oraz w regulacji neuropeptydów w ośrodkowym układzie nerwowym . Jedną z ich najważniejszych funkcji jest aktywacja biologicznie aktywnych peptydów, zwłaszcza peptydów biorących udział w regulacji ciśnienia krwi (angiotensyny i bradykininy). U ssaków ACE jest ważnym elementem układu renina – angiotensyna (RAS). ACE ulega ekspresji w sialotranskryptomach pijawki (Theromyzon tessulatum), ślimaka stożkowatego (Conidae), ślimaka wampirowatego (Colubraria reticulata) i gatunków dipteran (Diptera) .

Zidentyfikowane sekwencje egzopeptydaz rodziny M28 należą do karboksypeptydaz typu Q, znanych również jako dipeptydazy lizosomalne lub karboksypeptydazy glutaminianu osocza (PGCP). Wykazano, że peptydazy te biorą udział w regulacji metabolizmu wydzielanych peptydów w osoczu krwi i ośrodkowym układzie nerwowym u ssaków. Enzymy te wydają się służyć do dezaktywacji pewnych peptydów sygnalizacyjnych we krwi i są składnikami systemów hemoglobinolitycznych u pasożytów hematofagicznych, odgrywając rolę egzopeptydaz trawiennych. Co ważne, wydzieliny gruczołów ślinowych pijawek zawierają inhibitory karboksypeptydaz, które przypuszczalnie zapobiegają przedwczesnemu trawieniu posiłku z krwi przez inne typy peptydaz.

Dysmutaza ponadtlenkowa (EC 1.15.1.1)

Zidentyfikowaliśmy sekwencje wydzielanych enzymów z rodziny dysmutazy ponadtlenkowej (SODC, typ Cu/Zn). Ta rodzina metaloprotein jest typowa głównie dla eukariotów i bierze udział w inaktywacji wolnych rodników, co opóźnia procesy oksydacyjne. We krwi dysmutaza ponadtlenkowa katalizuje przekształcenie nadtlenku w tlen cząsteczkowy i nadtlenek wodoru oraz zapobiega powstawaniu nadtlenoazotynu i rodnika hydroksylowego. Co ciekawe, nadtlenoazotyn może hamować funkcje hemostatyczne poprzez nitrowanie kluczowych prokoagulantów, podczas gdy nadtlenek wodoru jest kluczową cząsteczką sygnalizacyjną zaangażowaną w regulację wielu procesów (koagulacji, zakrzepicy, fibrynolizy, angiogenezy i proliferacji). Przypuszcza się, że u kleszczy SODC bierze udział w regulacji kolonizacji przewodu pokarmowego przez bakterie, w tym czynniki wywołujące choroby. W SCS, SODC wydaje się wykazywać działanie antybakteryjne wraz z innymi białkami wrodzonego układu odpornościowego i zapobiega niepożądanemu utlenianiu krwi podczas żerowania i trawienia. Zwłaszcza związki zawierające hem i wolne żelazo są zaangażowane w tworzenie wolnych rodników i prowokowanie stresu oksydacyjnego.

Anhydraza węglanowa (EC 4.2.1.1)

Ezym ten jest kluczowym składnikiem systemu buforowego wodorowęglanu i jest zaangażowany w regulację wartości pH we krwi, przewodzie pokarmowym i innych tkankach. U zwierząt hematofagicznych, enzym ten może utrzymać optymalne warunki do trawienia posiłku krwi . Anhydraza węglanowa wydaje się powodować lokalny wzrost kwasicy w miejscu ukąszenia, zmniejszając aktywność czynników krzepnięcia krwi.

Hyaluronidaza (EC 3.2.1.35)

Enzymy te są powszechne w danych proteomicznych i transkryptomicznych zwierząt hematofagicznych i jadowitych. Wiadomo, że wydzieliny ślinowe różnych gatunków pijawek zawierają hialuronidazę (heparynazę, orgelazę) . W proteomie i transkryptomie znaleziono trzy klastry zawierające domenę rodziny hydrolaz glikozylowych 79 (O-glycosyl hydrolases). Rodzina ta obejmuje heparynazy, które odgrywają ważną rolę w tkankach łącznych. W jadach i wydzielinach gruczołów ślinowych enzymy te katalizują hydrolizę kwasu hialuronowego, powodując utratę integralności strukturalnej macierzy zewnątrzkomórkowej, a tym samym ułatwiając penetrację antykoagulantów i innych aktywnych cząsteczek w głąb tkanek. Ponadto, niskocząsteczkowa heparyna wytwarzana przez heparynazę hamuje krzepnięcie krwi.

Apipraza (EC 3.6.1.5)

Apiprazy są nukleotydazami zaangażowanymi w enzymatyczną degradację ATP i ADP do AMP. Wydzielane apyrazy i 5′-nukleazy są znanymi i dobrze scharakteryzowanymi składnikami wydzielin gruczołów ślinowych zwierząt jadowitych i hematofagicznych, w tym pijawek lekarskich. Apinazy są antykoagulantami, ponieważ usuwają ADP, ważny czynnik indukujący agregację płytek krwi w miejscach uszkodzenia tkanek .

Deaminaza adenozyny/AMP (EC:3.5.4.4)

katalizuje hydrolityczną deaminację adenozyny do postaci inozyny. Deaminazy adenozyny są dobrze zbadane i zostały znalezione w ślinie różnych owadów ssących krew. ADA znajduje się również w wydzielinie gruczołów ślinowych ślimaka wampira C. reticulata, należącego do Spiralia, jak również pijawek. Uważa się, że ADA odgrywa ważną rolę w usuwaniu adenozyny ze względu na jej udział w procesach percepcji bólu .

Inhibitory proteinaz

Antystasyny

Zidentyfikowaliśmy sekwencje odpowiadające inhibitorowi proteinaz I15 (antystasynie pijawki) Ryc. 4. Białka z tej rodziny występują powszechnie u krwiopijnych pijawek i odgrywają kluczową rolę w hamowaniu krzepnięcia krwi. Ich głównym celem są proteazy serynowe biorące udział w hemostazie, takie jak czynnik Xa, kallikreina, plazmina i trombina. Ghilanten, antistasin z Haementeria ghilianii, okazał się hamować agregację płytek krwi, a gigastasin z gigantycznej pijawki amazońskiej (Hementaria ghilianii) został niedawno zgłoszony jako silnie hamujący dopełniacz C1. Antistasin z Hementeria officinalis jest najbliższym homologiem sekwencji zidentyfikowanych w naszym badaniu.

Fig. 4
figure4

Multiple sequences alignment of Antistasin-like transcripts with dual domain antistasin-type protease inhibitors from leeches’ Antistasin (Haementeria officinalis, P15358), Ghilantein (Haementeria ghilianii, P16242) and Eisenstasin II from earthworm (Eisenia andrei, Q5D2M8). W ramkach zaznaczono domeny antystasynopodobne. Alignment został wygenerowany przez algorytm MUSCLE, reszty są pokolorowane zgodnie ze schematem kolorów ClustalX, konserwowane aminokwasy są pokolorowane według poziomu konserwacji (próg > 50%). Sekwencje referencyjne zaznaczono kolorem fioletowym

CAP/CRISP

Nadrodzina bogatych w cysteinę białek wydzielniczych/antygen 5/pathogenesis-related 1 proteins (CAP) obejmuje liczne rodziny białek, w szczególności bogate w cysteinę białka wydzielnicze (CRISP) Rys. 5a. Występują one powszechnie w jadach węży i innych gadów, a większość z nich jest toksynami. W niektórych badaniach uważano, że CRISP z gatunków hematofagicznych biorą udział w hemostazie (HP1). Zidentyfikowane sekwencje wykazują podobieństwo do sekwencji białkowych pochodzących z hematofagicznego pasożytniczego nicienia Ancylostoma caninum (tęgoryjca), takich jak bloker kanału potasowego AcK1 i możliwy inhibitor agregacji płytek krwi HPI , jak również do toksyn wężowych triflin (Protobothrops flavoviridis) i natrin-1 (Naja atra) . Wśród różnie ekspresjonowanych genów zidentyfikowaliśmy sekwencje z nowym motywem „Cys-rich” Ryc. 5b. Ta grupa białek charakteryzuje się obecnością peptydu sygnałowego oraz dwóch wzorów cysteinowych CX {5,14} CX {7} CX {8} СС {2} С i CX {7,17} CX {9} CX {8} СС {2} С.

Rys. 5
figure5

a Dostosowanie domen CRISP do różnych białek CAP/CRISP. Putative platelet inhibitors from Ancylostoma caninum (Q962V9) and Tabanus yao (C8YJ99), CAP domain containing proteins from Vampire Snail (Cumia reticulata, QBH70087.1; QBH70092.1) and reptile Cystein-rich venom proteins triflin (Protobothrops flavoviridis), natrin-2 (Naja atra) and other. Alignment został wygenerowany przy użyciu algorytmu MUSCLE, reszty są pokolorowane zgodnie ze schematem kolorów ClustalX, konserwowane aminokwasy są pokolorowane według poziomu konserwacji (próg > 50%). Sekwencje referencyjne zaznaczono kolorem fioletowym. b Wyrównanie nowych domen „bogatych w Cys”. Pola wskazują dwa wzorce cysteinowe, aminokwasy są kolorowane według procentowego schematu kolorowania Identity

Eglin-like

Egliny są małymi białkami pozbawionymi cysteiny, które należą do rodziny I13 inhibitorów proteinaz serynowych. Egliny pochodzące z pijawek mają aktywność hamującą wobec elastaz neutrofilów i katepsyn G, a także uczestniczą w ochronie zawartości roślin przed przedwczesną proteolizą. Na uwagę zasługuje fakt, że sekwencje zidentyfikowane w niniejszej pracy wykazują niską homologię do klasycznej egliny z pijawki lekarskiej Rys. 6a.

Fig. 6
figure6

a Amino acid sequences alignment of Eglin-like transcripts with Eglin (Hirudo medicinalis, P01051), hypothetical protein (Helobdella robusta, xp_009019226.1) and chymotrypsin inhibitor homolog from Potato (Solanum tuberosum, P01052). Alignment został wygenerowany przez algorytm MUSCLE, reszty są pokolorowane zgodnie ze schematem kolorów ClustalX. Reszty identyczne i konserwowane oznaczono odpowiednio gwiazdką, kropką i dwukropkiem. b Alignment of PAN domains with leech anti-platelet protein (Haementeria officinalis, Q01747) and putative anti-platelet-like protein (Haementeria vizottoi, A0A0P4VN18). Konserwowane aminokwasy są pokolorowane według poziomu konserwacji (próg > 75%). Sekwencje referencyjne są zaznaczone na fioletowo

Cystatyna

Sekwencję cystatyny zidentyfikowaliśmy tylko w proteomie H. verbana. Cystatyny są małymi białkowymi inhibitorami proteaz cysteinowych (katepsyn B, H, C, L, S) i są często znajdowane w sialotranskryptomach różnych kleszczy. U kleszczy cystatyny odgrywają ważną rolę w procesach związanych z odpowiedzią immunologiczną, regulacją endogennych proteaz cysteinowych biorących udział w trawieniu krwi i detoksykacji hemu. Nicień Nippostrongylus brasiliensis wykorzystuje cystatyny do omijania układu odpornościowego gospodarza.

Domena PAN

Domena ta jest obecna w wielu białkach, w tym w białkach krwi – plazminogenie i czynniku krzepnięcia XI. Wiadomo, że domena PAN/ jabłko prekallikreiny osocza pośredniczy w jej wiązaniu z kininogenem o dużej masie cząsteczkowej, a domena PAN/ jabłko czynnika XI wiąże się z czynnikami XIIa i IX, płytkami krwi, kininogenem i heparyną. W wydzielinie gruczołów ślinowych pijawki lekarskiej H. officinalis stwierdzono obecność białka przeciwpłytkowego pijawki lekarskiej (LAPP), które posiada domenę PAN i bierze udział w hemostazie. Białko to wykazuje powinowactwo do kolagenów I, III i IV, a tym samym hamuje adhezję płytek do kolagenu.

Alfa-2-makroglobulina (α2M)

Wysoce konserwowana, wielofunkcyjna α2M bierze udział w hamowaniu szerokiego zakresu proteaz (seryny, cysteiny, asparaginy i metaloproteaz), wchodzi w interakcje z cytokinami i hormonami oraz odgrywa rolę w chelatowaniu cynku i miedzi. Może działać jako inhibitor plazminy, hamując w ten sposób fibrynolizę, ale w niektórych przypadkach hamuje krzepnięcie poprzez inaktywację trombiny i kallikreiny. Uważa się, że białko to nie tylko bierze udział w procesach odpornościowych pijawek, ale także jest ważnym składnikiem wydzieliny gruczołów ślinowych, która wzmacnia procesy antykoagulacyjne.

Molekuły zaangażowane w adhezję

Fikolina

Fikoliny są składnikiem wrodzonego układu odpornościowego i uruchamiają zależną od lektyny ścieżkę aktywacji dopełniacza. U bezkręgowców fikoliny biorą udział w rozpoznawaniu składników ściany komórkowej bakterii. Domena fibrynogenopodobna jest obecna w białkach o powinowactwie do erytrocytów, np. tachylektyna-5A (TL5A). TL5A wykazuje silną aktywność hemaglutynacyjną i przeciwbakteryjną w obecności jonów Ca2+ . W jadach gadów, białka podobne do fikoliny, rynkolina (z Cerberus rynchops) i veficolin-1 (UniProt: E2IYB3) (z Varanus komodoensis), przypuszczalnie wywołują agregację płytek krwi i krzepnięcie krwi.

Domena F5/8 typu C

Liczba zidentyfikowanych sekwencji zawiera jeden lub kilka motywów dyskoidynowych (DS), znanych jako domena F5/8 typu C. Domena ta jest obecna w licznych białkach transmembranowych i zewnątrzkomórkowych, np. neuropilinach, neureksynie IV i białkach receptorowych z domeną dyskoidyny, a także w białkach zaangażowanych w hemostazę, takich jak czynniki krzepnięcia V i VIII . Domena DS odgrywa ważną rolę w wiązaniu różnych cząsteczek ligandów, w tym fosfolipidów i węglowodanów. Ze względu na te cechy, białka zawierające domenę DS są aktywnie zaangażowane w adhezję komórek, migrację oraz proliferację i aktywację kaskad sygnalizacyjnych. Białka zawierające domenę DS pijawki działają jak lektyny o wysokim powinowactwie do galaktozy i mogą być składnikami wrodzonego układu odpornościowego pijawki. Ponadto mogą one wiązać się z kolagenem lub fosfatydyloseryną na powierzchni płytek krwi i śródbłonka i w ten sposób, poprzez inhibicję kompetycyjną, upośledzać interakcje między czynnikami hemostatycznymi.

Receptor lipoprotein o małej gęstości a rodzina

Receptor lipoprotein o małej gęstości (LDLR) jest ważnym składnikiem osocza krwi i jest zaangażowany w rozpoznawanie i endocytozę lipoprotein o małej gęstości we krwi ssaków . W przeciwieństwie do znanych białek homologicznych, receptory te są raczej białkami wydzielniczymi niż błonowymi i zawierają cztery powtórzenia LDLR klasy A (bogate w cysteinę). Niektóre bezkręgowce, w tym robaki segmentowane, są hipotetycznie niezdolne do syntezy cholesterolu i hormonów steroidowych, a podczas żerowania pijawki pozyskują cholesterol głównie z krwi gospodarza jako źródła egzogennego. Postulujemy, że białko to może być wykorzystywane przez pijawkę do wymiatania i transportu kompleksów lipoproteinowych bogatych w cholesterol.

Lektyny typu R

Białka zawierające domenę lektyny beta-trefoil typu rycyny znaleziono u prokariotów i eukariotów. U zwierząt lektyny typu R wykazują zróżnicowaną aktywność. Występują w receptorach zmiatających (mannoza, fukoza, receptory kolagenowe), N-acetylogalaktozaminotransferazach, toksynach hemolitycznych (CEL-III z Cucumaria echinata) i cytotoksynach indukujących apoptozę. Wcześniej podobne sekwencje zidentyfikowano w transkryptomach pijawek, jednak autorzy założyli, że cząsteczka ta ma lokalizację mitochondrialną. Innym godnym uwagi bliskim homologiem jest lektyna EW29 z dżdżownicy Lumbricus terrestris, wiążąca galaktozę. EW29 składa się z dwóch homologicznych domen i eksperymentalnie wykazano, że wykazuje aktywność hemaglutynacyjną. Ponieważ wiele znanych lektyn typu R bierze udział w adhezji i wyzwala hemolizę, cząsteczka ta jest przedmiotem zainteresowania dalszych badań.

Domena VWFA

Domena ta jest obecna w różnych białkach osocza: czynnikach dopełniacza, integrynach i kolagenach VI, VII, XII i XIV . Jednym z białek zidentyfikowanych w proteomie pijawki jest białko wydzielane, które składa się z czterech kopii domeny vWFA Rys. 7. Sekwencja ta zawiera kilka przypuszczalnych miejsc rozpoznawania: miejsce adhezji zależne od jonów metali (MIDAS), miejsce wiązania integryny z kolagenem oraz miejsce wiązania glikoproteiny Ib (GpIb). Według analizy BlastX, domena ta jest homologiczna do kolagenu typu VI. Biorąc pod uwagę organizację domenową białka oraz obecność miejsc wiążących glikoproteiny i kolagen, jeden z przypuszczalnych mechanizmów działania polega na wiązaniu się z powierzchnią śródbłonka lub płytek krwi, zapobiegając w ten sposób ich interakcji z kolagenem. To wiązanie leży u podstaw kompetycyjnego hamowania podczas hemostazy (zmiatanie płytek krwi) .

Fig. 7
figure7

Alignment of the hirudo vWFA domains with the human vWFA1 (EAW88814.1) and vWFA1-like (Colubraria reticulata, SPP68597.1). Wyrównanie wygenerowano algorytmem MUSCLE, reszty pokolorowano zgodnie z kolorystyką ClustalX. Reszty identyczne i konserwowane oznaczono odpowiednio gwiazdką, kropką i dwukropkiem. Sekwencje referencyjne oznaczone są kolorem fioletowym

.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.