Entwürfe der Genomsequenzen von Hirudo medicinalis und des Speicheltranskriptoms dreier eng verwandter medizinischer Blutegel

Genomassemblierung und Annotation

Um das Genom von H. medicinalis zu assemblieren, extrahierten wir DNA aus einem erwachsenen Blutegel. Vor der Verarbeitung wurde der Blutegel mindestens 2 Monate lang ohne Fütterung gehalten. Wir erstellten einen Satz von drei Shotgun-Bibliotheken, um die Sequenzierung mit drei verschiedenen Plattformen durchzuführen (ergänzende Tabelle 1). Alle Lesedatensätze wurden kombiniert, und mit SPAdes wurde ein einziges Assembly erstellt. Das resultierende Assembly enthielt 168.624 Contigs mit einer N50-Contig-Länge von 12,9 kb (siehe Tabelle 2).

Vorläufige Analysen (Contigs BlastN) zeigten das Vorhandensein von bakteriellen Sequenzen im resultierenden Assembly. Daher haben wir Binning durchgeführt, um die Blutegel-Contigs (ein Blutegel-Bin) zu unterscheiden. Wir erstellten eine Verteilung der Contigs entsprechend ihrer GC-Häufigkeit, Tetranukleotid-Häufigkeit und Leseabdeckung. Um die Binning-Genauigkeit zu erhöhen, wurde die Read Coverage durch Kombination der DNA-Reads mit den Reads bestimmt, die einem kombinierten Transkriptom von H. medicinalis entsprechen (siehe unten). Die Unterscheidung der eukaryotischen und prokaryotischen Contigs ist in Abb. 1a/b, in der ergänzenden Tabelle 3 und in den ergänzenden Daten 2 dargestellt. Zusätzlich wählten wir die mitochondrialen Contigs aus, um das mitochondriale Genom des Blutegels zusammenzustellen.

Abb. 1
Abb. 1

Das H. medicinalis-Genom-Binning. a. 2D-Plot, der die Contig-Verteilung in Koordinaten des GC-Gehalts und der Abdeckung durch eine Kombination von Reads zeigt, die mit Ion Proton und Illumina gewonnen wurden. Contigs sind durch Punkte gekennzeichnet, und die taxonomische Zugehörigkeit der Contigs auf Domänenebene ist durch die Farbe kodiert (grün – Bakterien, blau – Eukarya, schwarz – keine Zuordnung). Die taxonomische Zugehörigkeit wurde durch direkte BlastN-Suche (Megablast) in der nt-Datenbank des National Center for Biotechnology Information (NCBI) ermittelt. Die 3D-Darstellung der Contig-Verteilung in Koordinaten des GC-Gehalts, der Read-Coverage (Proton und Illumina) und der Host-cDNA-Read-Coverage ist in den ergänzenden Daten 2 dargestellt. bH. medicinalis-Genom enthält Cluster von Blutmehl-bezogenen Genen. Die Grafik zeigt die Exon-Intron-Struktur von Genen und die Anordnung von Genclustern in Gerüsten auf einer allgemeinen Skala. Die Exon-Pfeile geben die Transkriptionsrichtung an (grau – unbekanntes Gen)

Die eukaryotischen Contigs wurden einem Scaffolding-Verfahren mit gepaarten Reads unterzogen. Scaffolds wurden mit Hilfe von SSPACE aus Illumina Paired-End- und Mate-Pair-Read-Datensätzen erzeugt. Nach dem Scaffolding bestand die Baugruppe aus 14.042 Sequenzen mit einer N50-Gerüstlänge von 98 kb (Ergänzende Tabellen 4 und 5). Die Länge des Blutegelgenoms wird auf 220-225 Mb geschätzt. Die Gesamtlänge des assemblierten Genomentwurfs beträgt 187,5 Mbp, was 85 % der theoretischen Größe des Blutegelgenoms entspricht (siehe ergänzende Tabelle 6). Insgesamt wurden 14.596 proteinkodierende Gene vorhergesagt.

Auch identifizierten wir neue Homologe von Genen, die für bekannte Antikoagulantien oder blutmahlzeitbezogene Proteine kodieren. Auf der Grundlage der Genomsequenzdaten und unter Verwendung bekannter Proteinsequenzen bestimmten wir die Organisation dieser Gene (ergänzende Tabelle 7, Abb. 1b). Die Positionen und Längen der Exons und Introns wurden unter Verwendung der jeweiligen cDNA- und Proteinsequenzen als Referenz vorhergesagt. In einigen Fällen sind Gene in gemeinsamen Gerüsten lokalisiert und bilden Tandems oder Cluster Abb. 1b.

mRNA-seq, Transkriptom-Zusammenbau und Annotation

Um gewebespezifische mRNA-Proben von drei medizinischen Blutegelarten, H. medicinalis, H. verbаna und H. orientalis, zu erhalten, isolierten wir Speichelzellen und Muskeln aus den Kryoschnitten der vorderen Körperteile mittels Laser-Mikrodissektion (Abb. 2a). Anschließend erstellten wir zwei cDNA-Bibliotheken mit und ohne Normalisierung für jede mRNA-Probe unter Verwendung des Oligo-dT-Primers und sequenzierten sie mit dem Ion Torrent PGM (siehe Tabelle 8). Vier Lesedatensätze, die den konstruierten cDNA-Bibliotheken entsprechen, wurden für die de-novo-Zusammenstellung eines kombinierten Transkriptoms für jede medizinische Blutegelart mit dem Trinity RNA Assembler verwendet (ergänzende Tabelle 9). Wir verwendeten die kombinierten Transkriptome, um nicht-normalisierte gewebespezifische Reads zu kartieren. Das Read-Mapping war notwendig, um eine konsekutive differentielle Expressionsanalyse durchzuführen.

Abb. 2
Abb. 2

Differenzielle Expressionsanalyse von Speichelzellen. (a) Isolierung von Speichelzellen und Muskeln durch Laser-Mikrodissektion. MA-Plots der differentiell exprimierten Gene in den Speichelzellen und Muskeln von H. medicinalis für das de novo assemblierte Transkriptom (b) und das Genommodell (c). MA-Plots, die die log Fold Change (logFC) gegen den log-durchschnittlichen log CPM für jedes Transkriptcluster in jedem Paar verglichener Proben (Muskel- und Speichelzellen) darstellen. Differentiell exprimierte Cluster, die durch FDR < 0,05 unterstützt werden, sind in rot dargestellt

Die Analyse der Gene Ontology (GO) der entdeckten Transkripte wurde mit Blast2GO und BlastX durchgeführt. Als Referenzdatenbank diente die ’nr‘-Datenbank. Die GO-Analyse zeigte, dass alle drei medizinischen Blutegelarten ähnliche Transkriptverteilungen in den GO-Kategorien aufwiesen (ergänzende Abbildung 3). Die taxonomische Verteilung der nächstgelegenen BlastX-Treffer war ebenfalls ähnlich (ergänzende Abbildung 4). Die meisten der identifizierten Transkripte wurden zwei Annelida-Arten zugeordnet: 59,8 % zu H. robusta und 10,7 % zu C. teleta. Diese Analyse bestätigte auch die Abwesenheit von Kontaminationen durch Nicht-Egel-Transkripte.

Die Vorhersage von kodierenden Regionen (oder offenen Leserahmen, ORFs) und die Annotation von Transkriptomdaten wurden mit Transdecoder und Trinotate durchgeführt. Die ORFs wurden mit dem BlastP-Algorithmus übersetzt, und die Proteinsequenzen wurden mit der EuKaryotic Orthologous Groups (KOG)-Klassifizierung unter Verwendung der eggNOG-Datenbank annotiert (siehe ergänzende Abbildung 5). Die KOG-Klassifizierung ergab, dass alle drei medizinischen Blutegelarten ähnliche Transkriptverteilungen in den KOG-Kategorien aufweisen. Es wurde auch festgestellt, dass alle drei medizinischen Blutegelarten die überwiegende Mehrheit ihrer orthologen Cluster gemeinsam haben (ergänzende Abbildung 6).

Differenzielle Expressionsanalyse

Um die relativen Expressionsniveaus der in den Speichelzellen und Muskeln identifizierten Transkripte abzuschätzen und um Transkripte zu identifizieren, die nur in den Speichelzellen vorkommen, haben wir die gewebespezifischen cDNA-Reads ohne Normalisierung auf das kombinierte Transkriptom jeder medizinischen Blutegelart abgebildet. Außerdem haben wir die gewebespezifischen cDNA-Reads von H. medicinalis mit seinem Genom abgeglichen. Differenziell exprimierte Gene wurden nach einem neuen Protokoll ermittelt. Zur Identifizierung von Genen, die in Speichelzellen und Muskeln unterschiedlich exprimiert werden, wurde für jede medizinische Blutegelart ein individueller MA-Plot unter Verwendung ihres kombinierten Transkriptoms erstellt (Abb. 2b, ergänzende Abbildung 7). Ein zusätzlicher MA-Plot wurde für H. medicinalis unter Verwendung seines Genomaufbaus erstellt (Abb. 2c). Gene mit einem q-Wert (FDR) < 0,05 wurden als differenziell exprimiert angesehen.

Wir identifizierten 102, 174 und 72 differenziell exprimierte Transkripte in den Speichelzellen von H. medicinalis, H. orientalis bzw. H. verbana. Da es sich bei den drei Arten um eng verwandte medizinische Blutegel handelt, wurden die Proteinsequenzen der unterschiedlich exprimierten Transkripte in orthologe Cluster gruppiert, um die anschließende Funktionsanalyse zu vereinfachen. Wir identifizierten 25 unterschiedlich exprimierte, orthologe Cluster, die von drei Blutegelarten gemeinsam genutzt werden, und 44 orthologe Cluster, die von mindestens zwei Blutegelarten gemeinsam genutzt werden (Abb. 3, ergänzende Tabellen 10-11). Die Mehrzahl der Sequenzen in den identifizierten orthologen Clustern entspricht hypothetischen Proteinen, die im Genom von H. robusta annotiert sind. Die Analyse der konservierten Domänen in den identifizierten orthologen Clustern ermöglichte die Bestimmung von Sequenzen, die zu bekannten Proteinfamilien gehören.

Abb. 3
Abbildung3

Zusammenfassung der identifizierten SCS-Komponenten. Die Venn-Diagramme im oberen Feld zeigen die Anzahl der Ortholog-Cluster, die durch differentielle Expressions- (DE) und Proteomanalysen (Prot) bei drei medizinischen Blutegelarten identifiziert wurden. Das Histogramm in der Mitte zeigt die Anzahl der orthologen Cluster, die durch die differentielle Expressionsanalyse, die proteomische Analyse oder eine Kombination davon (DE + Prot) identifiziert wurden. Jeder Balken besteht aus orthologen Clustern, die als bekannte bluternährungsbezogene Komponenten (identifiziert), andere bekannte Proteine (andere) und unbekannte Proteine (NA) identifiziert wurden. Die Tortendiagramme im unteren Feld veranschaulichen die Häufigkeit der einzelnen SCS-Komponenten, die durch die differentielle Expressionsanalyse, die Proteomanalyse oder ihre Kombination identifiziert wurden. Einzelheiten finden Sie in den ergänzenden Tabellen 10, 11 und 13

Wir analysierten auch die differenziell exprimierten Gene von H. medicinalis anhand seines Genomaufbaus. Die cDNA-Reads für die Speichelzellen, die Muskeln und das Nervengewebe (die Reads stammen aus dem Sequence Read Archive (SRA)) wurden auf den Genomaufbau abgebildet. Für das neurale Gewebe wurde ein Read-Datensatz für das Ganglion 2 verwendet, da es in den präoralen Segmenten lokalisiert ist. Bei der differenziellen Expressionsanalyse wurden 42 Gene identifiziert, die nur in den Speichelzellen von H. medicinalis vorkommen (ergänzende Tabelle 12).

Proteomik der Speichelzellsekretion

Für die Proteomanalyse sammelten wir SCS von drei medizinischen Blutegelarten, H. medicinalis, H. orientalis und H. verbana, die mindestens zwei Monate lang ohne Fütterung gehalten wurden. Die SCS wurden nach einer zuvor beschriebenen Methode mit einigen Modifikationen gesammelt (siehe Methoden).

Die Probenvorbereitungsmethode ist für das resultierende Repertoire der identifizierten Proteine von entscheidender Bedeutung, da die SCS sowohl aus Komponenten mit niedrigem als auch mit hohem Molekulargewicht bestehen und Proteinase-Inhibitoren, Glykoprotein-Komplexe und Lipide enthalten. Letztere können Komplexe mit Proteinen bilden. Daher haben wir mehrere Probenvorbereitungsmethoden und verschiedene Massenspektrometrietechniken kombiniert, um ein möglichst breites Repertoire an SCS-Proteinen zu erfassen. Die mit verschiedenen Probenvorbereitungsmethoden und Massenspektrometrietechniken gewonnenen Proteomdatensätze wurden kombiniert, um eine endgültige Liste der identifizierten Proteine für jede medizinische Blutegelart zu erstellen.

Wir identifizierten 189, 86 und 344 Proteine in den SCS von H. medicinalis, H. orientalis bzw. H. verbana und gruppierten sie wie oben beschrieben in orthologe Cluster. Alle drei medizinischen Blutegelarten hatten 39 orthologe Cluster gemeinsam, und 50 orthologe Cluster wurden von mindestens zwei Arten gemeinsam genutzt (Abb. 3, ergänzende Tabelle 13). Die Kombination der transkriptomischen und proteomischen Daten ergab 25 orthologe Cluster von Genen, die in den Speichelzellen auf einzigartige Weise exprimiert werden (ergänzende Tabelle 11). Eine Liste der einzelnen Komponenten des SCS der Blutegel ist in Abb. 3 dargestellt. Überraschenderweise zeigten die Gene, die für bekannte SCS-Antikoagulanzien und blutmahlzeitbezogene Proteine kodieren, keine unterschiedliche Expression zwischen Speichelzellen und Muskeln. Um diesen Befund zu bestätigen, untersuchten wir die Expression von Saratin, Eglin C, Bdellinen, Hirustasin, Destabilase, Metallocarboxypeptidase-Inhibitor, Apyrase und Angiotensin Converting Enzyme (ACE) durch Echtzeit-PCR zusätzlicher, unabhängiger gewebespezifischer cDNA-Bibliotheken, die für Speichelzellen und Muskeln erstellt wurden. Die Echtzeit-PCR-Ergebnisse für Hirudin und Destabilase (ergänzende Abbildung 8) bestätigten dieses Ergebnis. Dies deutet darauf hin, dass Gene, die für Antikoagulantien und blutmahlbezogene Proteine kodieren, nicht nur an der Blutversorgung beteiligt sind, sondern auch zu anderen, noch unbekannten physiologischen Funktionen beitragen.

Im Folgenden charakterisieren wir SCS-Komponenten, die in funktionelle Gruppen eingeteilt sind, und beschreiben ihre mögliche Rolle bei der Hämostase. Die Sequenzen der Proteine und ihr Alignment sind in den ergänzenden Abbildungen 9-24 dargestellt.

Enzyme

Proteasen

Die Ergebnisse dieser Studie zeigen, dass Metalloproteasen der М12-, M13- und M28-Familien die wichtigsten enzymatischen Komponenten des SCS sind. Die M12B (ADAM/Reprolysin)-Peptidasen sind eine große Familie von Desintegrin-ähnlichen Metalloproteinasen, die ein breites Spektrum an Funktionen haben und an vielen physiologischen Prozessen beteiligt sind. Diese Enzyme werden häufig in Schlangengiften gefunden, während die Transkripte in Sialotranskriptomen verschiedener hämatophager Arten zu finden sind. In der Hämostase können sekretierte Proteasen der М12-Familie an der Hemmung der Thrombozytenadhäsion und an der Erweichung des Blutgerinnsels durch den Abbau von Fibrinogen beteiligt sein. Diese Proteine weisen eine metallabhängige proteolytische Aktivität gegen extrazelluläre Matrixproteine (Gelatine, Fibrinogen, Fibronektin) auf und beeinflussen damit die Regulierung von Entzündungen und Immunreaktionen.

Bei Säugetieren sind Proteasen der M13-Familie an der Bildung und Entwicklung des Herz-Kreislauf-Systems und an der Regulierung von Neuropeptiden im zentralen Nervensystem beteiligt. Eine ihrer wichtigsten Funktionen ist die Aktivierung biologisch aktiver Peptide, insbesondere von Peptiden, die an der Regulierung des Blutdrucks beteiligt sind (Angiotensin und Bradykinin). Bei Säugetieren ist das ACE ein wichtiger Bestandteil des Renin-Angiotensin-Systems (RAS). ACE wird in den Sialotranskriptomen des Blutegels (Theromyzon tessulatum), der Kegelschnecke (Conidae), der Vampirschnecke (Colubraria reticulata) und von Diptera-Arten (Diptera) exprimiert.

Die identifizierten Sequenzen der Exopeptidasen der M28-Familie gehören zu den Carboxypeptidasen vom Q-Typ, die auch als lysosomale Dipeptidasen oder Plasma-Glutamat-Carboxypeptidase (PGCP) bezeichnet werden. Diese Peptidasen sind nachweislich an der Regulierung des Stoffwechsels von sezernierten Peptiden im Blutplasma und im zentralen Nervensystem von Säugetieren beteiligt. Diese Enzyme scheinen dazu zu dienen, bestimmte Signalpeptide im Blut zu deaktivieren, und sind Bestandteile hämoglobinolytischer Systeme in hämatophagen Parasiten, die die Rolle verdauungsfördernder Exopeptidasen spielen. Insbesondere enthalten die Speicheldrüsensekrete der Blutegel Carboxypeptidase-Inhibitoren, die vermutlich die vorzeitige Verdauung der Blutmahlzeit durch andere Peptidasenarten verhindern.

Superoxiddismutase (EC 1.15.1.1)

Wir haben Sequenzen von Enzymen der Familie der sezernierten Superoxiddismutasen (SODC, Cu/Zn-Typ) identifiziert. Diese Familie von Metalloproteinen ist hauptsächlich typisch für Eukaryoten und ist an der Inaktivierung freier Radikale beteiligt, die oxidative Prozesse verlangsamt. Im Blut katalysiert die Superoxiddismutase die Umwandlung von Superoxid in molekularen Sauerstoff und Wasserstoffperoxid und verhindert die Bildung von Peroxynitrit und Hydroxylradikalen. Interessanterweise kann Peroxynitrit die hämostatische Funktion durch Nitrierung wichtiger Prokoagulanzien unterdrücken, während Wasserstoffperoxid ein wichtiges Signalmolekül ist, das an der Regulierung zahlreicher Prozesse (Gerinnung, Thrombose, Fibrinolyse, Angiogenese und Proliferation) beteiligt ist. In Zecken ist SODC vermutlich an der Regulierung der Besiedlung des Verdauungstrakts durch Bakterien, einschließlich der Erreger von Krankheiten, beteiligt. In SCS scheint SODC zusammen mit anderen Proteinen des angeborenen Immunsystems eine antibakterielle Wirkung zu haben und verhindert eine unerwünschte Oxidation des Blutes während der Nahrungsaufnahme und Verdauung. Vor allem hämhaltige Verbindungen und freies Eisen sind an der Bildung freier Radikale und der Provokation von oxidativem Stress beteiligt.

Carbonsäureanhydrase (EC 4.2.1.1)

Dieses Enzym ist eine Schlüsselkomponente des Bikarbonatpuffersystems und an der Regulierung des pH-Werts im Blut, im Verdauungstrakt und in anderen Geweben beteiligt. Bei hämatophagen Tieren kann dieses Enzym optimale Bedingungen für die Verdauung einer Blutmahlzeit aufrechterhalten. Kohlensäureanhydrase scheint einen lokalen Anstieg der Azidose an der Bissstelle zu bewirken, wodurch die Aktivität der Blutgerinnungsfaktoren verringert wird.

Hyaluronidase (EC 3.2.1.35)

Diese Enzyme sind in den proteomischen und transkriptomischen Daten von hämatophagen und giftigen Tieren häufig zu finden. Es ist bekannt, dass die Speichelsekrete verschiedener Blutegelarten Hyaluronidase (Heparinase, Orgelase) enthalten. Im Proteom und Transkriptom fanden wir drei Cluster, die eine Domäne der Glycosylhydrolase-Familie 79 (O-Glycosylhydrolasen) enthalten. Zu dieser Familie gehören Heparinasen, die eine wichtige Rolle in Bindegeweben spielen. In Giften und Speicheldrüsensekreten katalysieren diese Enzyme die Hydrolyse von Hyaluronsäure, was zu einem Verlust der strukturellen Integrität der extrazellulären Matrix führt und dadurch das Eindringen von Antikoagulantien und anderen aktiven Molekülen in das Gewebe erleichtert. Darüber hinaus unterdrückt und hemmt das durch Heparinase gespaltene niedermolekulare Heparin die Blutgerinnung.

Apyrase (EC 3.6.1.5)

Apyrasen sind Nukleotidasen, die am enzymatischen Abbau von ATP und ADP zu AMP beteiligt sind. Sekretierte Apyrasen und 5′-Nukleasen sind bekannte und gut charakterisierte Bestandteile der Speicheldrüsensekrete von giftigen und hämatophagen Tieren, einschließlich Blutegeln. Apyrasen sind Antikoagulantien, da sie ADP, einen wichtigen Auslöser der Thrombozytenaggregation an Stellen von Gewebeverletzungen, entfernen.

Adenosin/AMP-Desaminase (EC:3.5.4.4)

katalysiert die hydrolytische Desaminierung von Adenosin zu Inosin. Adenosin-Desaminasen sind gut untersucht und wurden im Speichel verschiedener blutsaugender Insekten gefunden. ADA findet sich auch im Speicheldrüsensekret der Vampirschnecke C. reticulata, die zu den Spiralia gehört, sowie in Blutegeln. Es wird vermutet, dass ADA eine wichtige Rolle beim Abbau von Adenosin spielt, da es an Prozessen der Schmerzwahrnehmung beteiligt ist.

Proteinaseinhibitoren

Antistasine

Wir haben Sequenzen identifiziert, die dem Proteinaseinhibitor I15 (Blutegel-Antistasin) entsprechen Abb. 4. Proteine dieser Familie kommen häufig in blutsaugenden Blutegeln vor und spielen eine Schlüsselrolle bei der Hemmung der Blutgerinnung. Ihre Hauptziele sind Serinproteasen, die an der Blutstillung beteiligt sind, wie Faktor Xa, Kallikrein, Plasmin und Thrombin. Ghilanten, ein Antistasin aus Haementeria ghilianii, hemmt nachweislich die Thrombozytenaggregation, und Gigastasin aus dem Amazonas-Riesenegel (Hementaria ghilianii) hemmt nach jüngsten Berichten wirksam Komplement C1. Antistasin aus Hementeria officinalis ist das engste Homolog der in unserer Studie identifizierten Sequenzen.

Abbbb. 4
Abbildung4

Mehrfaches Sequenz-Alignment von Antistasin-ähnlichen Transkripten mit Protease-Inhibitoren des Dual-Domain-Antistasin-Typs aus Antistasin des Egels (Haementeria officinalis, P15358), Ghilantein (Haementeria ghilianii, P16242) und Eisenstasin II aus dem Regenwurm (Eisenia andrei, Q5D2M8). Die Kästen kennzeichnen Antistasin-ähnliche Domane. Das Alignment wurde mit dem MUSCLE-Algorithmus erstellt, die Reste sind nach dem ClustalX-Farbschema eingefärbt, konservierte Aminosäuren sind nach dem Konservierungsgrad eingefärbt (Schwellenwert > 50%). Referenzsequenzen sind lila markiert

CAP/CRISP

Die Superfamilie der cysteinreichen sekretorischen Proteine/Antigen 5/Pathogenesis-related 1-Proteine (CAP) umfasst zahlreiche Proteinfamilien, insbesondere das cysteinreiche sekretorische Protein (CRISP) Abb. 5a. Sie sind häufig in den Giften von Schlangen und anderen Reptilien zu finden, und die meisten von ihnen sind Toxine. In einigen Untersuchungen wurde vermutet, dass CRISPs aus hämatophagen Arten an der Hämostase beteiligt sind (HP1). Die identifizierten Sequenzen zeigen Ähnlichkeit mit Proteinsequenzen aus dem hämatophagen parasitären Fadenwurm Ancylostoma caninum (Hakenwurm), wie dem Kaliumkanalblocker AcK1 und dem möglichen Thrombozytenaggregationshemmer HPI , sowie mit den Schlangengiften Triflin (Protobothrops flavoviridis) und Natrin-1 (Naja atra) . Unter den differenziell exprimierten Genen identifizierten wir Sequenzen mit einem neuen „Cys-reichen“ Motiv (Abb. 5b). Diese Gruppe von Proteinen zeichnet sich durch das Vorhandensein eines Signalpeptids und zweier Cysteinmuster CX {5,14} CX {7} CX {8} СС {2} С und CX {7,17} CX {9} CX {8} СС {2} С.

Abb. 5
Abbildung5

a Alignment von CRISP-Domänen mit verschiedenen CAP/CRISP-Proteinen. Mutmaßliche Thrombozyteninhibitoren aus Ancylostoma caninum (Q962V9) und Tabanus yao (C8YJ99), CAP-Domänen enthaltende Proteine aus der Vampirschnecke (Cumia reticulata, QBH70087.1; QBH70092.1) und reptilienartige Cystein-reiche Giftproteine Triflin (Protobothrops flavoviridis), Natrin-2 (Naja atra) und andere. Das Alignment wurde mit dem MUSCLE-Algorithmus erstellt, die Reste sind nach dem ClustalX-Farbschema eingefärbt, konservierte Aminosäuren sind nach dem Konservierungsgrad eingefärbt (Schwellenwert > 50%). Die Referenzsequenz ist lila markiert. b Alignment der neuen „Cys-reichen“ Domänen. Die Kästchen zeigen zwei Cystein-Muster an, die Aminosäuren sind nach dem prozentualen Identitäts-Farbschema eingefärbt

Eglin-like

Eglins sind kleine cysteinfreie Proteine, die zur I13-Familie der Serinproteinase-Inhibitoren gehören. Eglins aus Blutegeln haben eine hemmende Wirkung gegen neutrophile Elastasen und Cathepsine G und sind auch am Schutz des Pflanzeninhalts vor vorzeitiger Proteolyse beteiligt. Bemerkenswert ist, dass die in der vorliegenden Studie identifizierten Sequenzen eine geringe Homologie mit dem klassischen Egel-Eglin aufweisen (Abb. 6a).

Abb. 6
Abbildung6

a Aminosäuresequenz-Alignment der Eglin-ähnlichen Transkripte mit Eglin (Hirudo medicinalis, P01051), hypothetischem Protein (Helobdella robusta, xp_009019226.1) und Chymotrypsin-Inhibitor-Homolog aus Kartoffel (Solanum tuberosum, P01052). Das Alignment wurde mit dem MUSCLE-Algorithmus erstellt, die Reste sind nach dem ClustalX-Farbschema gefärbt. Identische und konservierte Reste sind durch Sternchen, Punkt und Doppelpunkt gekennzeichnet. b Alignment der PAN-Domänen mit dem Anti-Thrombozyten-Protein des Egels (Haementeria officinalis, Q01747) und dem mutmaßlichen Anti-Thrombozyten-ähnlichen Protein (Haementeria vizottoi, A0A0P4VN18). Die konservierten Aminosäuren sind nach ihrem Erhaltungsgrad eingefärbt (Schwellenwert > 75%). Referenzsequenzen sind lila markiert

Cystatin

Wir haben eine Cystatin-Sequenz nur im Proteom von H. verbana identifiziert. Cystatine sind kleine Proteininhibitoren von Cysteinproteasen (Cathepsine B, H, C, L, S) und werden häufig in den Sialotranskriptomen verschiedener Zecken gefunden. In Zecken spielen Cystatine eine wichtige Rolle bei Prozessen im Zusammenhang mit der Immunantwort, der Regulierung endogener Cysteinproteasen, die an der Verdauung von Blut und der Häm-Entgiftung beteiligt sind. Der Fadenwurm Nippostrongylus brasiliensis nutzt Cystatine, um sich dem Immunsystem des Wirts zu entziehen.

PAN-Domäne

Diese Domäne ist in zahlreichen Proteinen vorhanden, darunter die Blutproteine Plasminogen und Gerinnungsfaktor XI . Es ist bekannt, dass die PAN/Apfel-Domäne des Plasmaprekallikreins dessen Bindung an hochmolekulares Kininogen vermittelt, und die PAN/Apfel-Domäne des Faktors XI bindet an die Faktoren XIIa und IX, an Blutplättchen, Kininogen und Heparin. Im Speicheldrüsensekret des Blutegels H. officinalis wurde das Blutegel-Antithrombozytenprotein (LAPP) gefunden, das eine PAN-Domäne besitzt und an der Blutstillung beteiligt ist. Dieses Protein weist eine Affinität zu den Kollagenen I, III und IV auf und hemmt dadurch die kollagenvermittelte Thrombozytenadhäsion.

Alpha-2-Makroglobulin (α2M)

Das hochkonservierte, multifunktionelle α2M ist an der Hemmung einer breiten Palette von Proteasen (Serin-, Cystein-, Asparagin- und Metalloproteasen) beteiligt, interagiert mit Zytokinen und Hormonen und spielt eine Rolle bei der Zink- und Kupferchelation. Es kann als Plasmin-Inhibitor wirken und dadurch die Fibrinolyse hemmen, in einigen Fällen hemmt es jedoch auch die Gerinnung durch Inaktivierung von Thrombin und Kallikrein. Man nimmt an, dass dieses Protein nicht nur an den Immunprozessen der Egel beteiligt ist, sondern auch ein wichtiger Bestandteil der Speicheldrüsensekretion ist, die die Gerinnungshemmung fördert.

Moleküle, die an der Adhäsion beteiligt sind

Ficolin

Ficoline sind ein Bestandteil des angeborenen Immunsystems und lösen einen Lektin-abhängigen Weg der Komplementaktivierung aus. Bei Wirbellosen sind Ficoline an der Erkennung von bakteriellen Zellwandbestandteilen beteiligt. Die fibrinogenähnliche Domäne ist in Proteinen mit Affinität zu Erythrozyten vorhanden, z. B. in Tachylectin-5A (TL5A). TL5A weist in Gegenwart von Ca2+-Ionen eine starke hämagglutinierende und antibakterielle Aktivität auf. In Reptiliengiften werden ficolinähnliche Proteine, Ryncolin (aus Cerberus rynchops) und Veficolin-1 (UniProt: E2IYB3) (aus Varanus komodoensis), als Auslöser für die Thrombozytenaggregation und Blutgerinnung vermutet.

F5/8-Typ-C-Domäne

Eine Reihe identifizierter Sequenzen enthält ein oder mehrere Discoidin-Motive (DS), die als F5/8-Typ-C-Domäne bekannt sind. Diese Domäne ist in zahlreichen transmembranen und extrazellulären Proteinen vorhanden, z. B. in Neuropilinen, Neurexin IV und Discoidin-Domänen-Rezeptorproteinen sowie in Proteinen, die an der Hämostase beteiligt sind, wie den Gerinnungsfaktoren V und VIII . Die DS-Domäne spielt eine wichtige Rolle bei der Bindung verschiedener Ligandenmoleküle, darunter Phospholipide und Kohlenhydrate. Aufgrund dieser Eigenschaften sind DS-haltige Proteine aktiv an der Zelladhäsion, der Migration, der Proliferation und der Aktivierung von Signalkaskaden beteiligt. Die DS-Domäne-enthaltenden Proteine des Blutegels scheinen als Lektine mit hoher Affinität zu Galaktose zu wirken und könnten Bestandteile des angeborenen Immunsystems des Egels sein. Darüber hinaus können sie an Kollagen oder Phosphatidylserin auf der Oberfläche von Thrombozyten und dem Endothel binden und so durch kompetitive Hemmung die Interaktionen zwischen hämostatischen Faktoren beeinträchtigen.

Low-Density-Lipoprotein-Rezeptor-a-Familie

Die Low-Density-Lipoprotein-Rezeptor (LDLR)-Familie ist ein wichtiger Bestandteil des Blutplasmas und ist an der Erkennung und Endozytose von Low-Density-Lipoproteinen im Säugetierblut beteiligt. Im Gegensatz zu den bekannten homologen Proteinen handelt es sich bei diesen Rezeptoren um sekretorische und nicht um Membranproteine, und sie enthalten vier LDLR-Wiederholungen der Klasse A (cysteinreich). Es wird angenommen, dass einige wirbellose Tiere, darunter segmentierte Würmer, nicht in der Lage sind, Cholesterin und Steroidhormone zu synthetisieren, und dass Blutegel bei der Nahrungsaufnahme Cholesterin hauptsächlich aus dem Blut des Wirts als exogene Quelle aufnehmen. Wir vermuten, dass dieses Protein vom Egel für das Auffangen und den Transport von cholesterinreichen Lipoproteinkomplexen verwendet wird.

R-Typ-Lektin

Proteine, die die Beta-Trefoil-Lektin-Domäne vom Ricin-Typ enthalten, wurden in Prokaryonten und Eukaryonten gefunden. In Tieren zeigen Lektine vom R-Typ verschiedene Aktivitäten. Sie sind in Scavenger-Rezeptoren (Mannose-, Fucose-, Kollagenrezeptoren), N-Acetylgalactosaminyltransferasen, hämolytischen Toxinen (CEL-III aus Cucumaria echinata) und Apoptose-induzierenden Zytotoxinen enthalten. Zuvor wurden ähnliche Sequenzen in Transkriptomen von Blutegeln identifiziert; die Autoren nahmen jedoch an, dass dieses Molekül mitochondrial lokalisiert ist. Ein weiteres bemerkenswertes nahes Homologes ist das galaktosebindende Lektin EW29 aus dem Regenwurm Lumbricus terrestris. EW29 besteht aus zwei homologen Domänen und hat experimentell nachgewiesen, dass es eine hämagglutinierende Aktivität aufweist. Da viele bekannte R-Typ-Lektine an der Adhäsion beteiligt sind und die Hämolyse auslösen, ist dieses Molekül für weitere Untersuchungen von Interesse.

vWFA-Domäne

Diese Domäne ist in verschiedenen Plasmaproteinen vorhanden: Komplementfaktoren, Integrine und Kollagene VI, VII, XII und XIV . Ein im Proteom der Blutegel identifiziertes Protein ist ein sekretiertes Protein, das aus vier Kopien der vWFA-Domäne besteht (Abb. 7). Die Sequenz enthält mehrere mutmaßliche Erkennungsstellen: die metallionenabhängige Adhäsionsstelle (MIDAS), die Integrin-Kollagen-Bindungsstelle und die Glykoprotein-Ib-Bindungsstelle (GpIb). Nach der BlastX-Analyse ist diese Domäne homolog zu Kollagen Typ VI. In Anbetracht der Domänenorganisation des Proteins und des Vorhandenseins von Glykoprotein- und Kollagenbindungsstellen besteht einer der mutmaßlichen Wirkmechanismen in der Bindung an die Oberfläche des Endothels oder der Blutplättchen, wodurch deren Interaktion mit Kollagen verhindert wird. Diese Bindung liegt der kompetitiven Hemmung während der Hämostase (Thrombozytenfängerei) zugrunde.

Abbildung 7
Abbildung7

Abgleich der hirudo vWFA-Domänen mit dem menschlichen vWFA1 (EAW88814.1) und vWFA1-like (Colubraria reticulata, SPP68597.1). Das Alignment wurde mit dem MUSCLE-Algorithmus erstellt, die Reste sind nach dem ClustalX-Farbschema gefärbt. Identische und konservierte Reste sind durch Sternchen, Punkt und Doppelpunkt gekennzeichnet. Die Referenzsequenz ist lila markiert

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.