Draft genome sequences of Hirudo medicinalis and salivary transcriptome of three closely related medicinal leeches

Genome assembly and annotation

Om het genoom van H. medicinalis te assembleren, hebben we DNA geëxtraheerd van een volwassen bloedzuiger. Voordat het DNA werd verwerkt, werd de bloedzuiger gedurende ten minste 2 maanden niet gevoed. We creëerden een set van drie shotgun bibliotheken om sequencing uit te voeren met behulp van drie verschillende platforms (Supplementary Table 1). Alle gelezen datasets werden gecombineerd, en een enkele montage werd gemaakt door SPAdes . De resulterende assemblage bevatte 168.624 contigs met een N50 contig lengte van 12,9 kb (Supplementary Table 2).

Preliminaire analyse (contigs BlastN) onthulde de aanwezigheid van bacteriële sequenties in de resulterende assemblage. Daarom voerden we binning om de bloedzuiger contigs (een bloedzuiger bin) te discrimineren. We bouwden een verdeling van contigs op basis van hun GC overvloed, tetranucleotide frequenties, en lees dekking. Om de binning nauwkeurigheid te verhogen, werd de gelezen dekking bepaald door het combineren van de DNA-lezen met de gelezen die overeenkomt met een gecombineerd transcriptoom van H. medicinalis (zie hieronder). Het onderscheid tussen de eukaryote en prokaryote contigs wordt geïllustreerd in Fig. 1a/b, supplementaire tabel 3 en supplementaire data 2. Daarnaast selecteerden we de mitochondriale contigs aan de bloedzuiger mitochondriale genoom assembleren .

Fig. 1
figure1

De H. medicinalis genoom binning. a. 2D-plot met de contig verdeling in coördinaten van GC-gehalte en de dekking door een combinatie van leest verkregen door Ion Proton en Illumina. Contigs worden aangegeven door stippen, en de taxonomische verwantschap van contigs op het domein niveau is gecodeerd door kleur (groen – Bacterie, blauw – Eukarya, zwart – geen toewijzing). De taxonomische verwantschap werd bepaald door rechtstreeks BlastN (megablast) te zoeken in de nt-databank van het National Center for Biotechnology Information (NCBI). De 3D-plot met de contig verdeling in coördinaten van GC-gehalte, lees dekking (Proton en Illumina), en gastheer cDNA lees dekking wordt gepresenteerd in Supplementary Data 2. bH. medicinalis genoom bevat clusters van bloedmeel-gerelateerde genen. De grafiek toont de exon-intron structuur van de genen en de rangschikking van genclusters in scaffolds op een algemene schaal. De exon pijlen geven de richting van transcriptie (grijs – onbekend gen)

De eukaryotische contigs onderging een scaffolding procedure met behulp van gepaarde leest. Scaffolds werden gegenereerd met behulp van Illumina paired-end en mate-paar gelezen datasets door SSPACE . Na scaffolding, de montage bestond uit 14.042 sequenties met een N50 steiger lengte van 98 kb (Supplementary tabellen 4 en 5). De lengte van het genoom van de bloedzuiger wordt geschat op 220-225 Mb. De totale lengte van het geassembleerde genoomontwerp bedraagt 187,5 Mbp, wat overeenkomt met 85% van de theoretische omvang van het bloedzuigergenoom (zie aanvullende tabel 6). In totaal werden 14.596 eiwit-coderende genen voorspeld.

Ook identificeerden we nieuwe homologs van genen die coderen voor bekende anticoagulantia of bloedmeel-gerelateerde proteïnen. De meervoudige aminozuuruitlijningen voor elk van deze eiwitfamilies (Supplementary Figs. 1, 2) Op basis van de genoomsequentiegegevens en met behulp van bekende eiwitsequenties bepaalden we de organisatie van deze genen (Supplementary Table 7, Fig. 1b). Posities en lengtes van exonen en intronen werden voorspeld met gebruikmaking van de respectieve cDNA- en eiwitsequenties als referenties. In sommige gevallen zijn genen gelokaliseerd in gemeenschappelijke scaffolds en vormen tandems of clusters Fig. 1b.

mRNA-seq, transcriptoom assemblage en annotatie

Om weefsel-specifieke mRNA monsters te verkrijgen van drie medicinale bloedzuigersoorten, H. medicinalis, H. verbаna, en H. orientalis, isoleerden we speekselcellen en spieren van de cryosecties van de voorste lichaamsdelen met behulp van laser microdissectie (Fig. 2a). Vervolgens construeerden we twee cDNA bibliotheken met en zonder normalisatie voor elk mRNA monster met behulp van de oligo-dT primer en sequencing ze op de Ion Torrent PGM (Supplementary Tabel 8). Vier gelezen datasets die overeenkomen met de geconstrueerde cDNA bibliotheken werden gebruikt voor de de novo montage van een gecombineerd transcriptoom voor elke medicinale bloedzuiger soorten met behulp van de Trinity RNA assembler (Supplementary Tabel 9). We gebruikten de gecombineerde transcriptomen om niet-genormaliseerde weefsel-specifieke leest kaart. Lezen mapping was nodig om opeenvolgende differentiële expressie analyse uit te voeren.

Fig. 2
figure2

Differentiële expressie analyse van speekselcellen. (a) Isolatie van speekselcellen en spieren door laser microdissectie. MA-grafieken van differentieel tot expressie komende genen in de speekselcellen en spieren van H. medicinalis voor het de novo geassembleerde transcriptoom (b) en het genoommodel (c). MA-plots die de log Fold Change (logFC) tegen de log-gemiddelde log CPM per elk transcript cluster over elk paar vergeleken monsters (spier en speekselcellen). Differentieel tot expressie clusters ondersteund door FDR < 0,05 zijn uitgezet in rood

Gene Ontologie (GO) analyse van de gedetecteerde transcripten werd uitgevoerd met behulp van Blast2GO en BlastX. De “nr”-databank diende als referentiedatabank. GO analyse toonde aan dat alle drie medicinale bloedzuigersoorten vergelijkbare transcript distributies over GO categorieën hadden (supplementaire figuur 3). De taxonomie verdeling van de dichtstbijzijnde BlastX hits was ook vergelijkbaar (Supplementary Figuur 4). De meerderheid van de geïdentificeerde transcripten bleken overeen te komen met twee soorten Annelida: 59,8% met H. robusta en 10,7% met C. teleta. Deze analyse bevestigde ook de afwezigheid van contaminatie door niet-leech transcripten.

De voorspelling van coderende regio’s (of open read frames, ORF’s) en annotatie van transcriptomische gegevens werden uitgevoerd met Transdecoder en Trinotate. ORFs werden vertaald met behulp van het BlastP algoritme, en de eiwitsequenties werden geannoteerd door EuKaryotic Orthologous Groups (KOG) classificatie met behulp van de eggNOG database (Supplementary Figuur 5). De KOG classificatie bleek dat alle drie medicinale bloedzuigersoorten hebben vergelijkbare transcript distributies over KOG categorieën. Alle drie medicinale bloedzuigersoorten bleken ook de overgrote meerderheid van hun orthologe clusters te delen (Supplementair Figuur 6).

Differentiële expressie analyse

Om de relatieve expressieniveaus van de in de speekselcellen en spieren geïdentificeerde transcripten te schatten en om transcripten te identificeren die uniek zijn voor de speekselcellen, brachten we de weefselspecifieke cDNA-leest zonder normalisatie in kaart tegen het gecombineerde transcriptoom van elke medicinale bloedzuigersoort. We brachten ook de weefsel-specifieke cDNA gegevens van H. medicinalis in kaart tegen zijn genoom-assemblage. Differentieel tot expressie komende genen werden gedetecteerd volgens een recent protocol. Om genen die differentieel tot expressie komen in de speekselcellen en spieren te identificeren, werd een individuele MA plot geconstrueerd voor elke medicinale bloedzuiger soort met behulp van de gecombineerde transcriptoom (Fig. 2b, Supplementary Figuur 7). Een extra MA plot werd geconstrueerd voor H. medicinalis met behulp van zijn genoom-assemblage (Fig. 2c). Genen met een q-waarde (FDR) < 0,05 werden beschouwd als differentieel tot expressie komend.

We identificeerden 102, 174, en 72 differentieel tot expressie komende transcripten in de speekselcellen van H. medicinalis, H. orientalis, en H. verbana, respectievelijk. Omdat de drie nauw verwante medicinale bloedzuigersoorten zijn, werden de eiwitsequenties van de differentieel tot expressie gebrachte transcripten gegroepeerd in orthologe clusters om de daaropvolgende functionele analyse te vereenvoudigen. We identificeerden 25 differentieel tot expressie gebrachte, orthologe clusters gedeeld door drie bloedzuigersoorten en 44 orthologe clusters gedeeld door ten minste twee bloedzuigersoorten (Fig. 3, supplementaire tabellen 10-11). De meeste sequenties in de geïdentificeerde orthologe clusters komen overeen met hypothetische eiwitten die in het genoom van H. robusta zijn geannoteerd. Analyse van de geconserveerde domeinen in de geïdentificeerde orthologe clusters maakte het mogelijk sequenties te bepalen die tot bekende eiwitfamilies behoren.

Fig. 3
figure3

Samenvatting van de geïdentificeerde SCS-componenten. De Venn-diagrammen in het bovenste paneel tonen het aantal orthologe clusters die zijn geïdentificeerd door differentiële expressie (DE) en proteomische (Prot) analyses bij drie medicinale bloedzuigersoorten. Het histogram in het middenpaneel toont de aantallen orthologe clusters die zijn geïdentificeerd door de differentiële expressie analyse, proteomische analyse of een combinatie daarvan (DE + Prot). Elke staaf bestaat uit orthologe clusters geïdentificeerd als bekende bloedvoedingsgerelateerde componenten (geïdentificeerd), andere bekende eiwitten (overig), en onbekende eiwitten (NA). De taartdiagrammen in het onderste paneel illustreren de overvloed van de individuele SCS componenten geïdentificeerd door de differentiële expressie analyse, proteomische analyse of hun combinatie. Voor details, zie de aanvullende tabellen 10, 11, en 13

We analyseerden ook de differentieel tot expressie komende genen van H. medicinalis met behulp van zijn genoom-assemblage. De cDNA gelezen voor de speekselcellen, spieren en neuraal weefsel (gelezen werden verkregen uit de Sequence Read Archive (SRA)) werden in kaart gebracht op het genoom assemblage. Voor het neurale weefsel, gebruikten we een gelezen dataset voor ganglion 2 vanwege de lokalisatie in de pre-orale segmenten. Differentiële expressie analyse identificeerde 42 genen die uniek zijn voor de speekselcellen van H. medicinalis (Supplementary Table 12).

Proteomics of salivary cell secretion

Voor proteomische analyse, verzamelden we SCS van drie medicinale bloedzuigersoorten, H. medicinalis, H. orientalis, en H. verbana, die werden onderhouden zonder voeding gedurende ten minste 2 maanden. De SCS werden verzameld volgens een eerder gerapporteerde methode met enkele wijzigingen (zie Methoden).

De methode van monstervoorbereiding is van cruciaal belang voor het resulterende repertoire van de geïdentificeerde eiwitten, omdat de SCS bestaat uit zowel laag- als hoogmoleculaire componenten en proteaseremmers, glycoproteïnecomplexen, en lipiden bevat. Deze laatste kunnen complexen vormen met eiwitten. Daarom combineerden we verschillende monstervoorbereidingsmethoden en verschillende massaspectrometrische technieken om het breedste repertoire van SCS eiwitten te bestrijken. Proteomische datasets verkregen door verschillende monstervoorbereidingsmethoden en massaspectrometrische technieken werden gecombineerd om een definitieve lijst te maken van de geïdentificeerde eiwitten voor elke medicinale bloedzuigersoort.

We identificeerden 189, 86, 344 eiwitten in de SCS’s van respectievelijk H. medicinalis, H. orientalis, en H. verbana, en groepeerden ze in orthologe clusters zoals hierboven beschreven. Alle drie medicinale bloedzuigersoorten bleken 39 orthologe clusters te delen, en 50 orthologe clusters werden door ten minste twee soorten gedeeld (Fig. 3, supplementaire tabel 13). Combinatie van de transcriptomische en proteomische gegevens bracht 25 orthologe clusters van genen aan het licht die op unieke wijze tot expressie komen in de speekselcellen (supplementaire tabel 11). Een lijst van de individuele componenten van het SCS van de bloedzuiger is gegeven in Fig. 3. Verrassend genoeg vertoonden de genen die coderen voor bekende SCS anticoagulanten en bloedmeel-gerelateerde eiwitten geen differentiële expressie tussen speekselcellen en spieren. Om deze bevinding te valideren, onderzochten we de expressie van saratine, eglin C, bdellines, hirustasine, destabilase, metallocarboxypeptidase inhibitor, apyrase, en angiotensine converting enzyme (ACE) door middel van real-time PCR van aanvullende, onafhankelijke weefselspecifieke cDNA bibliotheken, geconstrueerd voor speekselcellen en spieren. De real-time PCR-resultaten voor hirudine en destabilase (supplementaire figuur 8) bevestigden deze bevinding. Dit wijst erop dat genen die coderen voor anticoagulantia en bloedmeel-gerelateerde eiwitten niet alleen betrokken zijn bij de bloedtoevoer, maar ook bijdragen aan andere, nog onbekende fysiologische functies.

Hieronder karakteriseren we SCS-componenten ingedeeld in functionele groepen en beschrijven we hun mogelijke rol in de hemostase. De sequenties van de proteïnen en hun uitlijning worden voorgesteld in de supplementaire Figs. 9-24.

Enzymen

Proteasen

De resultaten van deze studie tonen aan dat metalloproteasen van de М12, M13, en M28 families de belangrijkste enzymatische componenten van het SCS zijn. De M12B (ADAM/reprolysine) peptidasen zijn een grote familie van desintegrine-achtige metalloproteïnasen die een breed scala van functies hebben en betrokken zijn bij vele fysiologische processen . Deze enzymen worden vaak aangetroffen in slangengif, terwijl de transcripten worden waargenomen in sialotranscriptomen van diverse hematofage soorten . In de hemostase kunnen gesecreteerde proteasen van de М12-familie een rol spelen bij de remming van de adhesie van bloedplaatjes en bij de verweking van stolsels door de afbraak van fibrinogeen. Deze eiwitten vertonen metaal-afhankelijke proteolytische activiteit tegen extracellulaire matrix-eiwitten (gelatine, fibrinogeen, fibronectine), waardoor zij de regulatie van ontsteking en immuunreacties beïnvloeden.

In zoogdieren zijn proteasen van de M13-familie betrokken bij de vorming en ontwikkeling van het cardiovasculaire systeem en bij de regulatie van neuropeptiden in het centrale zenuwstelsel . Een van hun belangrijkste functies is de activering van biologisch actieve peptiden, met name peptiden die betrokken zijn bij de regulering van de bloeddruk (angiotensine en bradykinine). Bij zoogdieren is ACE een belangrijk onderdeel van het renine-angiotensinesysteem (RAS). ACE komt tot expressie in de sialotranscriptomen van de bloedzuiger (Theromyzon tessulatum), de kegelslak (Conidae), de vampierslak (Colubraria reticulata), en dipteransoorten (Diptera).

De geïdentificeerde sequenties van exopeptidasen van de M28-familie behoren tot de carboxypeptidasen van het Q-type, ook bekend als lysosomale dipeptidasen of plasmaglutamaatcarboxypeptidase (PGCP). Aangetoond is dat deze peptidasen betrokken zijn bij de regulering van het metabolisme van afgescheiden peptiden in het bloedplasma en het centrale zenuwstelsel bij zoogdieren. Deze enzymen blijken te dienen om bepaalde signaalpeptiden in het bloed te deactiveren en zijn componenten van hemoglobinolytische systemen bij hematofage parasieten, waarbij zij de rol spelen van spijsverteringsexopeptidasen . Met name de speekselklierafscheidingen van bloedzuigers bevatten carboxypeptidaseremmers, die vermoedelijk een voortijdige vertering van het bloedmeel door andere soorten peptidasen voorkomen.

Superoxide-dismutase (EC 1.15.1.1)

We hebben sequenties geïdentificeerd van gesecreteerde enzymen van de superoxide-dismutase-familie (SODC, Cu/Zn-type). Deze familie van metalloproteïnen is vooral kenmerkend voor eukaryoten en is betrokken bij de inactivering van vrije radicalen, waardoor oxidatieve processen worden vertraagd. In het bloed katalyseert superoxide dismutase de omzetting van superoxide in moleculaire zuurstof en waterstofperoxide en voorkomt het de vorming van peroxynitriet en hydroxylradicalen. Interessant is dat peroxynitriet de hemostatische functie kan onderdrukken door de nitratie van belangrijke procoagulanten, terwijl waterstofperoxide een belangrijke signaalmolecule is die betrokken is bij de regulatie van vele processen (coagulatie, trombose, fibrinolyse, angiogenese, en proliferatie). Bij teken wordt verondersteld dat SODC deelneemt aan de regulering van de kolonisatie van het darmkanaal door bacteriën, waaronder de veroorzakers van ziekten. In SCS blijkt SODC samen met andere proteïnen van het aangeboren immuunsysteem een antibacteriële werking te vertonen en ongewenste oxidatie van het bloed tijdens het voeden en de spijsvertering te voorkomen. Met name haembevattende verbindingen en vrij ijzer zijn betrokken bij de vorming van vrije radicalen en de provocatie van oxidatieve stress.

Carbonzuuranhydrase (EC 4.2.1.1)

Dit enzym is een sleutelcomponent van het bicarbonaat-buffersysteem en is betrokken bij de regulering van pH-waarden in het bloed, het spijsverteringskanaal, en andere weefsels. Bij hematofaag dieren kan dit enzym optimale omstandigheden handhaven voor de vertering van een bloedmaaltijd . Koolzuuranhydrase lijkt een lokale verhoging van de acidose op de plaats van de beet te veroorzaken, waardoor de activiteit van de bloedstollingsfactoren afneemt.

Hyaluronidase (EC 3.2.1.35)

Deze enzymen komen veel voor in de proteomische en transcriptomische gegevens van hematofage en giftige dieren. Het is bekend dat de speekselafscheidingen van verschillende soorten bloedzuigers hyaluronidase (heparinase, orgelase) bevatten. In het proteoom en transcriptoom vonden we drie clusters die een domein bevatten van de glycosylhydrolase familie 79 (O-glycosylhydrolases). Deze familie omvat heparinases, die een belangrijke rol spelen in bindweefsels. In gif en speekselklierafscheidingen katalyseren deze enzymen de hydrolyse van hyaluronzuur, waardoor de structurele integriteit van de extracellulaire matrix verloren gaat en anticoagulantia en andere actieve moleculen gemakkelijker dieper in de weefsels kunnen doordringen . Bovendien onderdrukt en remt de door heparinase geproduceerde splitsing van heparine met een laag molecuulgewicht de bloedstolling.

Apyrase (EC 3.6.1.5)

Apyrases zijn nucleotidases die betrokken zijn bij de enzymatische afbraak van ATP en ADP tot AMP. Afgescheiden apyrasen en 5′-nucleasen zijn bekende en goed gekarakteriseerde componenten van de speekselklierafscheidingen van giftige en hematofage dieren, waaronder bloedzuigers. Apyrases zijn anticoagulantia omdat ze ADP verwijderen, een belangrijke inducer van bloedplaatjesaggregatie op plaatsen van weefselverwonding.

Adenosine/AMP deaminase (EC:3.5.4.4)

katalyseert de hydrolytische deaminatie van adenosine tot inosine. Adenosine deaminases zijn goed bestudeerd en zijn aangetroffen in het speeksel van verschillende bloedzuigende insecten. ADA wordt ook aangetroffen in de speekselklierafscheiding van de vampierslak C. reticulata, die tot de Spiralia behoort, en in bloedzuigers. ADA wordt verondersteld een belangrijke rol te spelen bij de verwijdering van adenosine vanwege zijn betrokkenheid bij pijnperceptieprocessen .

Proteïnaseremmers

Antistasines

We identificeerden sequenties die overeenkomen met proteïnaseremmer I15 (bloedzuigerantistasine) Fig. 4. Eiwitten van deze familie worden algemeen aangetroffen in bloedzuigende bloedzuigers en spelen een sleutelrol bij de remming van de bloedstolling. Hun voornaamste doelwitten zijn serine proteasen die een rol spelen in de hemostase, zoals factor Xa, kallikrein, plasmine en trombine. Van Ghilanten, een antistasine uit Haementeria ghilianii, is aangetoond dat het de aggregatie van bloedplaatjes remt, en van gigastasine uit de reuzenbloedzuiger uit het Amazonegebied (Hementaria ghilianii) is onlangs gemeld dat het krachtig complement C1 remt. Antistasine uit Hementeria officinalis is de dichtstbijzijnde homoloog van de sequenties die in onze studie zijn geïdentificeerd.

Fig. 4
figure4

Multiple sequences alignment of Antistasin-like transcripts with dual domain antistasin-type protease inhibitors from leeches’ Antistasin (Haementeria officinalis, P15358), Ghilantein (Haementeria ghilianii, P16242) and Eisenstasin II from earthworm (Eisenia andrei, Q5D2M8). De vakjes geven antistasine-achtige domane aan. Alignment is gegenereerd door MUSCLE algoritme, residuen zijn gekleurd volgens ClustalX kleurenschema, geconserveerde aminozuren zijn gekleurd door behoudsniveau (drempel > 50%). Referentiesequenties zijn paars gemarkeerd

CAP/CRISP

De superfamilie van cysteïnerijke secretorische proteïnen/antigenen 5/pathogenese-gerelateerde 1 proteïnen (CAP) omvat talrijke eiwitfamilies, met name cysteïnerijke secretorische proteïnen (CRISP) Fig. 5a. Zij worden algemeen aangetroffen in het gif van slangen en andere reptielen, en de meeste ervan zijn toxinen. In sommige onderzoeken werd gedacht dat CRISP’s van hematofage soorten betrokken waren bij hemostase (HP1). De geïdentificeerde sequenties vertonen gelijkenis met eiwitsequenties van de hematofage parasitaire nematode Ancylostoma caninum (haakworm), zoals de kaliumkanaalblokker AcK1 en de mogelijke bloedplaatjesaggregatieremmer HPI , alsook met de slangengiffen triflin (Protobothrops flavoviridis) en natrin-1 (Naja atra) . Onder de differentieel tot expressie gebrachte genen, identificeerden wij sequenties met een nieuw “Cys-rijk” motief Fig. 5b. Deze groep eiwitten wordt gekenmerkt door de aanwezigheid van een signaalpeptide en twee cysteïnepatronen CX {5,14} CX {7} CX {8} СС {2} С en CX {7,17} CX {9} CX {8} СС {2} С.

Fig. 5
figure5

a Uitlijning van CRISP-domeinen met diverse CAP/CRISP-proteïnen. Putatieve bloedplaatjesremmers van Ancylostoma caninum (Q962V9) en Tabanus yao (C8YJ99), CAP-domein-bevattende eiwitten van de vampierslak (Cumia reticulata, QBH70087.1; QBH70092.1) en cystein-rijke gif-eiwitten van reptielen, triflin (Protobothrops flavoviridis), natrin-2 (Naja atra) en andere. Alignment is gegenereerd door MUSCLE algoritme, residuen zijn gekleurd volgens ClustalX kleurenschema, geconserveerde aminozuren zijn gekleurd door behoudsniveau (drempel > 50%). Referentiesequenties zijn paars gemarkeerd. b Uitlijning van nieuwe “Cys-rijke” domeinen. De vakjes geven twee cysteïnepatronen aan, aminozuren zijn gekleurd volgens percentage Identiteit kleurenschema

Eglin-like

Eglins zijn kleine cysteïnevrije eiwitten die behoren tot de I13 familie van serine proteïnase inhibitors . Eglines van bloedzuigers hebben remmende activiteit tegen neutrofiele elastases en cathepsines G en nemen ook deel aan de bescherming van de kropinhoud tegen ontijdige proteolyse . Van belang is dat de in de huidige studie geïdentificeerde sequenties een geringe homologie vertonen met het klassieke eglin van de bloedzuiger Fig. 6a.

Fig. 6
figure6

a Aminozuursequentie-uitlijning van Eglin-achtige transcripten met Eglin (Hirudo medicinalis, P01051), hypothetisch eiwit (Helobdella robusta, xp_009019226.1) en chymotrypsine-inhibitor-homoloog uit Aardappel (Solanum tuberosum, P01052). Alignment is gegenereerd met het MUSCLE algoritme, residuen zijn gekleurd volgens het ClustalX kleurenschema. Identieke en geconserveerde residuen respectievelijk aangegeven met asterisk, punt en dubbele punt. b Uitlijning van PAN-domeinen met bloedzuiger anti-plaatjes-eiwit (Haementeria officinalis, Q01747) en putatief anti-plaatjes-achtig eiwit (Haementeria vizottoi, A0A0P4VN18). Geconserveerde aminozuren zijn gekleurd volgens graad van conservering (drempel > 75%). Referentiesequenties zijn paars gemarkeerd

Cystatine

Wij identificeerden een cystatine-sequentie alleen in het proteoom van H. verbana. Cystatines zijn kleine eiwitremmers van cysteïneproteasen (cathepsines B, H, C, L, S) en worden vaak aangetroffen in de sialotranscriptomen van verschillende teken. Bij teken spelen cystatines een belangrijke rol in processen die verband houden met de immuunrespons, de regulering van endogene cysteïne proteases die betrokken zijn bij de vertering van bloed en hemo-ontgifting . De nematode Nippostrongylus brasiliensis maakt gebruik van cystatines om het immuunsysteem van de gastheer te omzeilen.

PAN domein

Dit domein is aanwezig in talrijke eiwitten, waaronder de bloedeiwitten plasminogeen en stollingsfactor XI . Van het PAN/appel-domein van plasma prekallikrein is bekend dat het de binding met hoog-moleculair-gewicht kininogeen medieert, en het PAN/appel-domein van de factor XI bindt aan de factoren XIIa en IX, bloedplaatjes, kininogeen, en heparine . De speekselklierafscheiding van de bloedzuiger H. officinalis bleek het bloedzuiger-antiplaatjes-eiwit (LAPP) te bevatten, dat een PAN-domein heeft en betrokken is bij de hemostase. Dit eiwit heeft affiniteit met collagenen I, III en IV en remt daardoor de collageen-gemedieerde adhesie van bloedplaatjes.

Alpha-2-macroglobuline (α2M)

De sterk geconserveerde, multifunctionele α2M is betrokken bij de remming van een breed scala van proteasen (serine-, cysteïne-, asparagine- en metalloproteasen), heeft een wisselwerking met cytokinen en hormonen, en speelt een rol bij de zink- en koperchelering. Het kan werken als een plasminremmer, waardoor de fibrinolyse wordt geremd, maar in sommige gevallen remt het de coagulatie door trombine en kallikreïne te inactiveren. Aangenomen wordt dat dit eiwit niet alleen betrokken is bij de immuunprocessen van bloedzuigers, maar ook een belangrijke component is van de speekselklierafscheiding die de antistollingsprocessen bevordert.

Moleculen betrokken bij adhesie

Ficoline

Ficolines zijn een component van het aangeboren immuunsysteem en activeren een lectine-afhankelijke complementactiveringsroute. Bij ongewervelden zijn ficolines betrokken bij de herkenning van bacteriële celwandcomponenten . Het fibrinogeenachtige domein is aanwezig in eiwitten met affiniteit voor erytrocyten, bijvoorbeeld tachylectine-5A (TL5A). TL5A vertoont een sterke hemagglutinerende en antibacteriële activiteit in de aanwezigheid van Ca2+ ionen. In reptielengif wordt aangenomen dat ficoline-achtige eiwitten, ryncoline (van Cerberus rynchops) en veficoline-1 (UniProt: E2IYB3) (van Varanus komodoensis), bloedplaatjesaggregatie en bloedstolling op gang brengen.

F5/8 type C-domein

Een aantal geïdentificeerde sequenties bevat een of meer discoidinemotieven (DS), bekend als het F5/8 type C-domein. Dit domein is aanwezig in talrijke transmembraan- en extracellulaire eiwitten, b.v. neuropilines, neurexine IV, en discoidinedomein-receptoreiwitten, en in eiwitten die betrokken zijn bij de hemostase, zoals de stollingsfactoren V en VIII . Het DS-domein speelt een belangrijke rol bij de binding van diverse ligandmoleculen, waaronder fosfolipiden en koolhydraten . Door deze eigenschappen zijn DS-bevattende eiwitten actief betrokken bij celadhesie, migratie, en de proliferatie en activering van signaalcascades . Eiwitten die het DS-domein van de bloedzuiger bevatten, blijken te werken als lectines met een hoge affiniteit voor galactose en zijn mogelijk componenten van het aangeboren immuunsysteem van de bloedzuiger. Bovendien kunnen zij zich binden aan collageen of fosfatidylserine op het oppervlak van bloedplaatjes en het endotheel en zo, door competitieve remming, interacties tussen hemostatische factoren belemmeren.

Lage-densiteit-lipoproteïne-receptor a-familie

De lage-densiteit-lipoproteïne-receptor (LDLR)-familie is een belangrijke component van het bloedplasma en is betrokken bij de herkenning en endocytose van lage-densiteit-lipoproteïnen in het bloed van zoogdieren . In tegenstelling tot bekende homologe eiwitten zijn deze receptoren eerder secretorische dan membraaneiwitten, en zij bevatten vier LDLR klasse A (cysteïnerijke) herhalingen. Van sommige ongewervelde dieren, waaronder gesegmenteerde wormen, wordt verondersteld dat zij niet in staat zijn tot de synthese van cholesterol en steroïde hormonen, en tijdens het voeden verkrijgen bloedzuigers cholesterol voornamelijk uit het bloed van de gastheer als een exogene bron. Wij stellen dat dit eiwit door de bloedzuiger kan worden gebruikt voor het wegvangen en transporteren van cholesterolrijke lipoproteïnecomplexen.

R-type lectine

Eiwitten die het ricine-type beta-trefoil lectine domein bevatten zijn gevonden in prokaryoten en eukaryoten. Bij dieren vertonen lectines van het R-type uiteenlopende activiteiten. Zij zijn aanwezig in scavenger receptoren (mannose-, fucose-, collageenreceptoren), N-acetylgalactosaminyltransferasen, hemolytische toxinen (CEL-III van Cucumaria echinata) en apoptose-inducerende cytotoxinen . Eerder werden soortgelijke sequenties geïdentificeerd in de transcriptomen van bloedzuigers; de auteurs veronderstelden echter dat deze molecule een mitochondriale lokalisatie heeft. Een andere opmerkelijke nauwe homoloog is het galactose-bindende lectine EW29 van de regenworm Lumbricus terrestris. EW29 bestaat uit twee homologe domeinen en van EW29 is experimenteel aangetoond dat het hemagglutinerende activiteit vertoont. Aangezien veel bekende lectines van het R-type betrokken zijn bij adhesie en hemolyse veroorzaken, is dit molecuul interessant voor verdere studie.

vWFA domein

Dit domein is aanwezig in verschillende plasma-eiwitten: complement-factoren, integrines, en collagenen VI, VII, XII, en XIV . Eén eiwit dat is geïdentificeerd in het proteoom van de bloedzuiger is een gesecreteerd eiwit dat bestaat uit vier kopieën van het vWFA-domein Fig. 7. De sequentie bevat verschillende vermoedelijke herkenningspunten: de metaalion-afhankelijke adhesieplaats (MIDAS), de integrine-collageen bindingsplaats, en de glycoproteïne Ib (GpIb) bindingsplaats. Volgens BlastX-analyse is dit domein homoloog met collageen type VI. Gezien de organisatie van de domeinen van het eiwit en de aanwezigheid van bindingsplaatsen voor glycoproteïne en collageen, bestaat een van de veronderstelde werkingsmechanismen uit binding aan het oppervlak van het endotheel of de bloedplaatjes, waardoor hun interactie met collageen wordt verhinderd. Deze binding ligt ten grondslag aan de competitieve remming tijdens hemostase (platelet scavenging).

Fig. 7
figure7

Alignering van de hirudo vWFA-domeinen met het menselijke vWFA1 (EAW88814.1) en vWFA1-like (Colubraria reticulata, SPP68597.1). Alignment is gegenereerd door het MUSCLE algoritme, residuen zijn gekleurd volgens het ClustalX kleurenschema. Identieke en geconserveerde residuen respectievelijk aangegeven met een sterretje, punt en dubbele punt. Referentiesequentie zijn paars gemarkeerd

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.