Projet de séquences génomiques de Hirudo medicinalis et transcriptome salivaire de trois sangsues médicinales étroitement apparentées

Assemblage et annotation du génome

Pour assembler le génome de H. medicinalis, nous avons extrait l’ADN d’une sangsue adulte. Avant d’être traitée, la sangsue a été maintenue sans alimentation pendant au moins 2 mois. Nous avons créé un ensemble de trois bibliothèques shotgun pour effectuer le séquençage en utilisant trois plateformes différentes (Tableau supplémentaire 1). Tous les ensembles de données de lecture ont été combinés, et un seul assemblage a été créé par SPAdes . L’assemblage résultant contenait 168 624 contigs avec une longueur de contigs N50 de 12,9 kb (tableau supplémentaire 2).

Une analyse préliminaire (contigs BlastN) a révélé la présence de séquences bactériennes dans l’assemblage résultant. Par conséquent, nous avons effectué un binning pour discriminer les contigs de sangsue (un bin de sangsue). Nous avons construit une distribution des contigs en fonction de leur abondance de GC, de leur fréquence de tétranucléotides et de leur couverture de lecture. Pour augmenter la précision du classement, la couverture de lecture a été déterminée en combinant les lectures d’ADN avec les lectures correspondant à un transcriptome combiné de H. medicinalis (voir ci-dessous). La discrimination des contigs eucaryotes et procaryotes est illustrée dans les figures 1a/b, le tableau supplémentaire 3 et les données supplémentaires 2. En outre, nous avons sélectionné les contigs mitochondriaux pour assembler le génome mitochondrial de la sangsue.

Fig. 1
figure1

Le regroupement du génome de H. medicinalis. a. Graphique 2D montrant la distribution des contigs en coordonnées de contenu GC et de couverture par une combinaison de lectures obtenues par Ion Proton et Illumina. Les contigs sont indiqués par des points, et l’affiliation taxonomique des contigs au niveau du domaine est codée par la couleur (vert – Bactéries, bleu – Eukarya, noir – aucune affectation). L’affiliation taxonomique a été déterminée par une recherche directe BlastN (megablast) contre la base de données nt du National Center for Biotechnology Information (NCBI). Le graphique 3D montrant la distribution des contigs en coordonnées de contenu GC, de couverture de lecture (Proton et Illumina) et de couverture de lecture de l’ADNc de l’hôte est présenté dans les données supplémentaires 2. bLe génome de H. medicinalis contient des groupes de gènes liés à la farine de sang. Le graphique montre la structure exon-intron des gènes et la disposition des groupes de gènes dans les échafaudages sur une échelle générale. Les flèches d’exon indiquent la direction de la transcription (en gris – gène inconnu)

Les contigs eucaryotes ont subi une procédure d’échafaudage en utilisant des lectures appariées. Les échafaudages ont été générés à l’aide de jeux de données de lectures paires et mates-paires d’Illumina par SSPACE . Après échafaudage, l’assemblage comprenait 14 042 séquences avec une longueur d’échafaudage N50 de 98 kb (tableaux supplémentaires 4 et 5). La longueur du génome de la sangsue est estimée à 220-225 Mb. La longueur totale de l’ébauche du génome assemblé est de 187,5 Mbp, ce qui correspond à 85 % de la taille théorique du génome de la sangsue (voir le tableau supplémentaire 6). Un total de 14 596 gènes codant pour des protéines a été prédit.

De plus, nous avons identifié de nouveaux homologues de gènes codant pour des anticoagulants connus ou des protéines liées aux repas sanguins. Les alignements multiples d’acides aminés pour chacune de ces familles de protéines (figures supplémentaires 1, 2) Sur la base des données de la séquence du génome et en utilisant les séquences de protéines connues, nous avons déterminé l’organisation de ces gènes (tableau supplémentaire 7, figure 1b). Les positions et les longueurs des exons et des introns ont été prédites en utilisant les séquences respectives d’ADNc et de protéines comme références. Dans certains cas, les gènes sont localisés dans des échafaudages communs et forment des tandems ou des clusters Fig. 1b.

mRNA-seq, assemblage et annotation du transcriptome

Pour obtenir des échantillons d’ARNm spécifiques aux tissus de trois espèces de sangsues médicinales, H. medicinalis, H. verbаna, et H. orientalis, nous avons isolé les cellules salivaires et les muscles à partir des cryosections des parties antérieures du corps en utilisant la microdissection au laser (Fig. 2a). Ensuite, nous avons construit deux bibliothèques d’ADNc avec et sans normalisation pour chaque échantillon d’ARNm en utilisant l’amorce oligo-dT et nous les avons séquencées sur l’Ion Torrent PGM (Tableau supplémentaire 8). Quatre ensembles de données de lecture correspondant aux bibliothèques d’ADNc construites ont été utilisés pour l’assemblage de novo d’un transcriptome combiné pour chaque espèce de sangsue médicinale en utilisant l’assembleur d’ARN Trinity (tableau supplémentaire 9). Nous avons utilisé les transcriptomes combinés pour cartographier les lectures non normalisées spécifiques aux tissus. La cartographie des lectures était nécessaire pour effectuer une analyse d’expression différentielle consécutive.

Fig. 2
figure2

Analyse d’expression différentielle des cellules salivaires. (a) Isolement des cellules salivaires et des muscles par microdissection laser. MA-plots des gènes différentiellement exprimés dans les cellules salivaires et les muscles de H. medicinalis pour le transcriptome assemblé de novo (b) et le modèle de génome (c). Graphiques MA représentant le log Fold Change (logFC) par rapport au log CPM moyen pour chaque groupe de transcription dans chaque paire d’échantillons comparés (muscle et cellules salivaires). Les groupes exprimés de manière différentielle soutenus par FDR < 0,05 sont tracés en rouge

L’analyse de l’ontologie des gènes (GO) des transcrits détectés a été effectuée en utilisant Blast2GO et BlastX. La base de données ‘nr’ a servi de base de données de référence. L’analyse GO a démontré que les trois espèces de sangsues médicinales avaient des distributions de transcrits similaires dans les catégories GO (figure supplémentaire 3). La distribution taxonomique des résultats les plus proches de BlastX était également similaire (figure supplémentaire 4). La majorité des transcrits identifiés correspondaient à deux espèces d’Annelida : 59,8 % à H. robusta et 10,7 % à C. teleta. Cette analyse a également confirmé l’absence de contamination par des transcrits non sangsues.

La prédiction des régions codantes (ou cadres de lecture ouverts, ORF) et l’annotation des données transcriptomiques ont été réalisées à l’aide de Transdecoder et Trinotate. Les ORF ont été traduits à l’aide de l’algorithme BlastP, et les séquences protéiques ont été annotées par la classification EuKaryotic Orthologous Groups (KOG) en utilisant la base de données eggNOG (figure supplémentaire 5). La classification KOG a révélé que les trois espèces de sangsues médicinales ont des distributions de transcription similaires à travers les catégories KOG. On a également constaté que les trois espèces de sangsues médicinales partagent la grande majorité de leurs groupes orthologues (figure supplémentaire 6).

Analyse de l’expression différentielle

Pour estimer les niveaux d’expression relatifs des transcrits identifiés dans les cellules salivaires et les muscles et pour identifier les transcrits uniques aux cellules salivaires, nous avons cartographié les lectures d’ADNc spécifiques aux tissus sans normalisation par rapport au transcriptome combiné de chaque espèce de sangsue médicinale. Nous avons également mis en correspondance les lectures d’ADNc spécifiques des tissus de H. medicinalis avec l’assemblage de son génome. Les gènes exprimés de façon différentielle ont été détectés selon un protocole récent. Pour identifier les gènes qui sont exprimés de manière différentielle dans les cellules salivaires et les muscles, un graphique MA individuel a été construit pour chaque espèce de sangsue médicinale en utilisant son transcriptome combiné (Fig. 2b, Figure supplémentaire 7). Un graphique MA supplémentaire a été construit pour H. medicinalis en utilisant son assemblage génomique (Fig. 2c). Les gènes avec une valeur q (FDR) < 0,05 ont été considérés comme exprimés de manière différentielle.

Nous avons identifié 102, 174, et 72 transcrits exprimés de manière différentielle dans les cellules salivaires de H. medicinalis, H. orientalis, et H. verbana, respectivement. Comme ces trois espèces de sangsues médicinales sont étroitement liées, les séquences protéiques des transcrits exprimés de manière différentielle ont été regroupées en groupes orthologues afin de simplifier l’analyse fonctionnelle ultérieure. Nous avons identifié 25 groupes orthologues différentiellement exprimés, partagés par trois espèces de sangsues et 44 groupes orthologues partagés par au moins deux espèces de sangsues (Fig. 3, Tableaux supplémentaires 10-11). La majorité des séquences dans les groupes orthologues identifiés correspondent à des protéines hypothétiques annotées dans le génome de H. robusta. L’analyse des domaines conservés dans les clusters orthologues identifiés a permis de déterminer les séquences appartenant à des familles de protéines connues.

Fig. 3
figure3

Résumé des composants SCS identifiés. Les diagrammes de Venn dans le panneau supérieur montrent le nombre de clusters d’orthologues identifiés par des analyses d’expression différentielle (DE) et protéomiques (Prot) à travers trois espèces de sangsues médicinales. L’histogramme du panneau central présente le nombre de groupes orthologues identifiés par l’analyse d’expression différentielle, l’analyse protéomique ou une combinaison de celles-ci (DE + Prot). Chaque barre est constituée de groupes d’orthologues identifiés comme des composants connus liés à l’alimentation sanguine (identifiés), d’autres protéines connues (autres) et des protéines inconnues (NA). Les diagrammes circulaires du panneau inférieur illustrent l’abondance des composants individuels du SCS identifiés par l’analyse d’expression différentielle, l’analyse protéomique ou leur combinaison. Pour plus de détails, voir les tableaux supplémentaires 10, 11 et 13

Nous avons également analysé les gènes différentiellement exprimés de H. medicinalis en utilisant son assemblage de génome. Les lectures d’ADNc pour les cellules salivaires, les muscles et le tissu neural (les lectures ont été obtenues à partir de la Sequence Read Archive (SRA)) ont été mappées sur l’assemblage du génome. Pour le tissu neural, nous avons utilisé un ensemble de données de lecture pour le ganglion 2 en raison de sa localisation dans les segments préoraux. L’analyse d’expression différentielle a identifié 42 gènes uniques aux cellules salivaires de H. medicinalis (tableau supplémentaire 12).

Protéomique de la sécrétion des cellules salivaires

Pour l’analyse protéomique, nous avons collecté les SCS de trois espèces de sangsues médicinales, H. medicinalis, H. orientalis, et H. verbana, qui ont été maintenues sans alimentation pendant au moins 2 mois. Les SCS ont été collectés selon une méthode rapportée précédemment avec quelques modifications (voir Méthodes).

La méthode de préparation de l’échantillon est critique pour le répertoire résultant des protéines identifiées car le SCS est constitué de composants de faible et de haut poids moléculaire et contient des inhibiteurs de protéinase, des complexes glycoprotéiques et des lipides. Ces derniers peuvent former des complexes avec les protéines. Par conséquent, nous avons combiné plusieurs méthodes de préparation des échantillons et plusieurs techniques de spectrométrie de masse pour couvrir le plus large répertoire de protéines du SCS. Les ensembles de données protéomiques obtenus par différentes méthodes de préparation des échantillons et techniques de spectrométrie de masse ont été combinés pour créer une liste finale des protéines identifiées pour chaque espèce de sangsue médicinale.

Nous avons identifié 189, 86, 344 protéines dans les SCS de H. medicinalis, H. orientalis, et H. verbana, respectivement, et les avons regroupées en groupes orthologues comme décrit ci-dessus. On a constaté que les trois espèces de sangsues médicinales partageaient 39 groupes orthologues, et que 50 groupes orthologues étaient partagés par au moins deux espèces (Fig. 3, Tableau supplémentaire 13). La combinaison des données transcriptomiques et protéomiques a révélé 25 groupes orthologues de gènes exprimés de manière unique dans les cellules salivaires (tableau supplémentaire 11). Une liste des composants individuels du SCS de la sangsue est donnée dans la Fig. 3. De façon surprenante, les gènes codant pour les anticoagulants connus du SCS et les protéines liées au repas sanguin n’ont pas montré d’expression différentielle entre les cellules salivaires et les muscles. Pour valider ce résultat, nous avons examiné l’expression de la saratine, de l’égline C, des bdellines, de l’hirustasine, de la déstabilase, de l’inhibiteur de la métallocarboxypeptidase, de l’apyrase et de l’enzyme de conversion de l’angiotensine (ECA) par PCR en temps réel de bibliothèques d’ADNc supplémentaires, indépendantes et spécifiques des tissus, construites pour les cellules salivaires et les muscles. Les résultats de la PCR en temps réel pour l’hirudine et la déstabilase (figure supplémentaire 8) ont confirmé cette découverte. Cela indique que les gènes codant pour les anticoagulants et les protéines liées au repas sanguin sont impliqués non seulement dans l’alimentation sanguine, mais contribuent à d’autres fonctions physiologiques encore inconnues.

Ci-après, nous caractérisons les composants du SCS classés en groupes fonctionnels et décrivons leurs rôles possibles dans l’hémostase. Les séquences des protéines et leur alignement sont présentés dans les figures supplémentaires 9-24.

Enzymes

Protéases

Les résultats de cette étude montrent que les métalloprotéases des familles М12, M13 et M28 sont les principaux composants enzymatiques du SCS. Les peptidases M12B (ADAM/reprolysine) sont une grande famille de métalloprotéases de type désintégration qui ont un large éventail de fonctions et sont impliquées dans de nombreux processus physiologiques . Ces enzymes sont souvent présentes dans les venins de serpents, tandis que leurs transcrits sont observés dans les sialotranscriptomes de diverses espèces hématophages. Dans l’hémostase, les protéases sécrétées de la famille М12 peuvent participer à l’inhibition de l’adhésion plaquettaire et au ramollissement du caillot dû à la dégradation du fibrinogène. Ces protéines présentent une activité protéolytique métal-dépendante contre les protéines de la matrice extracellulaire (gélatine, fibrinogène, fibronectine), affectant ainsi la régulation de l’inflammation et des réponses immunitaires.

Chez les mammifères, les protéases de la famille M13 sont impliquées dans la formation et le développement du système cardiovasculaire et dans la régulation des neuropeptides dans le système nerveux central . L’une de leurs fonctions les plus importantes est l’activation de peptides biologiquement actifs, en particulier les peptides impliqués dans la régulation de la pression artérielle (angiotensine et bradykinine). Chez les mammifères, l’ACE est un composant important du système rénine-angiotensine (SRA). L’ACE est exprimée dans les sialotranscriptomes de la sangsue (Theromyzon tessulatum), de l’escargot conique (Conidae), de l’escargot vampire (Colubraria reticulata) et des espèces de diptères (Diptera) .

Les séquences identifiées des exopeptidases de la famille M28 appartiennent aux carboxypeptidases de type Q, également connues sous le nom de dipeptidases lysosomales ou de glutamate carboxypeptidase plasmatique (PGCP). Il a été démontré que ces peptidases participent à la régulation du métabolisme des peptides sécrétés dans le plasma sanguin et le système nerveux central des mammifères. Ces enzymes semblent servir à désactiver certains peptides de signalisation dans le sang et sont des composants des systèmes hémoglobinolytiques des parasites hématophages, jouant le rôle d’exopeptidases digestives. Notamment, les sécrétions des glandes salivaires des sangsues contiennent des inhibiteurs de carboxypeptidases, qui empêchent vraisemblablement la digestion intempestive du repas sanguin par d’autres types de peptidases .

Superoxyde dismutase (EC 1.15.1.1)

Nous avons identifié des séquences d’enzymes sécrétées de la famille des superoxyde dismutases (SODC, type Cu/Zn). Cette famille de métalloprotéines est principalement typique des eucaryotes et est impliquée dans l’inactivation des radicaux libres, ce qui retarde les processus oxydatifs. Dans le sang, la superoxyde dismutase catalyse la conversion du superoxyde en oxygène moléculaire et en peroxyde d’hydrogène et empêche la formation de peroxynitrite et de radicaux hydroxyle. Il est intéressant de noter que le peroxynitrite peut supprimer la fonction hémostatique par la nitration de procoagulants clés, tandis que le peroxyde d’hydrogène est une molécule de signalisation clé impliquée dans la régulation de nombreux processus (coagulation, thrombose, fibrinolyse, angiogenèse et prolifération). Chez les tiques, on suppose que la SODC participe à la régulation de la colonisation du tractus intestinal par les bactéries, y compris les agents responsables des maladies . Chez les SCS, la SODC semble présenter un effet antibactérien avec d’autres protéines du système immunitaire inné et empêche l’oxydation indésirable du sang pendant l’alimentation et la digestion. Notamment, les composés contenant de l’hème et le fer libre sont impliqués dans la formation de radicaux libres et la provocation du stress oxydatif .

Anhydrase carbonique (EC 4.2.1.1)

Cette enzyme est un composant clé du système tampon bicarbonate et est impliquée dans la régulation des valeurs de pH dans le sang, le tube digestif et d’autres tissus . Chez les animaux hématophages, cette enzyme peut maintenir des conditions optimales pour la digestion d’un repas de sang. L’anhydrase carbonique semble provoquer une augmentation locale de l’acidose au site de la morsure, diminuant l’activité des facteurs de coagulation du sang.

Hyaluronidase (EC 3.2.1.35)

Ces enzymes sont communes dans les données protéomiques et transcriptomiques des animaux hématophages et venimeux. Les sécrétions salivaires de différentes espèces de sangsues sont connues pour contenir de la hyaluronidase (héparinase, orgelase) . Dans le protéome et le transcriptome, nous avons trouvé trois clusters contenant un domaine de la famille 79 des glycosyl hydrolases (O-glycosyl hydrolases). Cette famille comprend les héparinases, qui jouent un rôle important dans les tissus conjonctifs. Dans les venins et les sécrétions des glandes salivaires, ces enzymes catalysent l’hydrolyse de l’acide hyaluronique, ce qui entraîne une perte de l’intégrité structurelle de la matrice extracellulaire et facilite ainsi la pénétration des anticoagulants et d’autres molécules actives dans les tissus. En outre, l’héparine de faible poids moléculaire produite par le clivage par l’héparinase supprime et inhibe la coagulation sanguine .

Apyrase (EC 3.6.1.5)

Les apyrases sont des nucléotidases impliquées dans la dégradation enzymatique de l’ATP et de l’ADP en AMP. Les apyrases et 5′-nucléases sécrétées sont des composants bien connus et bien caractérisés des sécrétions des glandes salivaires des animaux venimeux et hématophages, y compris les sangsues . Les apyrases sont des anticoagulants car elles éliminent l’ADP, un inducteur important de l’agrégation plaquettaire aux sites de lésions tissulaires .

L’adénosine/AMP désaminase (EC:3.5.4.4)

catalyse la désamination hydrolytique de l’adénosine pour former l’inosine. Les adénosine désaminases sont bien étudiées et ont été trouvées dans la salive de divers insectes suceurs de sang . L’ADA est également présente dans la sécrétion de la glande salivaire de l’escargot vampire C. reticulata, qui appartient à Spiralia, ainsi que dans les sangsues. On pense que l’ADA joue un rôle important dans l’élimination de l’adénosine en raison de son implication dans les processus de perception de la douleur .

Inhibiteurs de protéase

Antistasines

Nous avons identifié des séquences correspondant à l’inhibiteur de protéase I15 (antistase de sangsue) Fig. 4. Les protéines de cette famille sont communément trouvées chez les sangsues suceuses de sang et jouent un rôle clé dans l’inhibition de la coagulation sanguine. Leurs principales cibles sont les sérines protéases participant à l’hémostase, comme le facteur Xa, la kallikréine, la plasmine et la thrombine. Il a été démontré que le ghilanten, une antistase de Haementeria ghilianii, inhibe l’agrégation plaquettaire, et il a été récemment signalé que la gigastase de la sangsue géante de l’Amazone (Hementaria ghilianii) inhibe puissamment le complément C1. L’antistasin de Hementeria officinalis est le plus proche homologue des séquences identifiées dans notre étude.

Fig. 4
figure4

Alignement de séquences multiples de transcrits de type antistasin avec des inhibiteurs de protéase à double domaine de type antistasin des sangsues Antistasin (Haementeria officinalis, P15358), Ghilantein (Haementeria ghilianii, P16242) et Eisenstasin II du ver de terre (Eisenia andrei, Q5D2M8). Les cases indiquent les domanes semblables aux antistasines. L’alignement est généré par l’algorithme MUSCLE, les résidus sont colorés selon le schéma de couleurs de ClustalX, les acides aminés conservés sont colorés par le niveau de conservation (seuil > 50%). Les séquences de référence sont marquées en violet

CAP/CRISP

La superfamille des protéines sécrétoires riches en cystéine/antigène 5/protéines liées à la pathogenèse 1 (CAP) comprend de nombreuses familles de protéines, notamment les protéines sécrétoires riches en cystéine (CRISP) Fig. 5a. On les trouve couramment dans les venins de serpents et d’autres reptiles, et la plupart d’entre elles sont des toxines. Dans certaines recherches, on a pensé que les CRISP des espèces hématophages étaient impliquées dans l’hémostase (HP1). Les séquences identifiées présentent des similitudes avec des séquences protéiques du nématode parasite hématophage Ancylostoma caninum (ankylostome), telles que le bloqueur de canal potassique AcK1 et le possible inhibiteur d’agrégation plaquettaire HPI, ainsi qu’avec les toxines de serpent triflin (Protobothrops flavoviridis) et natrin-1 (Naja atra). Parmi les gènes différentiellement exprimés, nous avons identifié des séquences avec un nouveau motif « riche en Cys » Fig. 5b. Ce groupe de protéines est caractérisé par la présence d’un peptide signal et de deux motifs cystéine CX {5,14} CX {7} CX {8} СС {2} С et CX {7,17} CX {9} CX {8} СС {2} С.

Fig. 5
figure5

a Alignement des domaines CRISP avec diverses protéines CAP/CRISP. Inhibiteurs plaquettaires putatifs d’Ancylostoma caninum (Q962V9) et Tabanus yao (C8YJ99), protéines contenant le domaine CAP de l’escargot vampire (Cumia reticulata, QBH70087.1 ; QBH70092.1) et protéines de venin riches en cystéine de reptile triflin (Protobothrops flavoviridis), natrin-2 (Naja atra) et autres. L’alignement est généré par l’algorithme MUSCLE, les résidus sont colorés selon le schéma de couleurs de ClustalX, les acides aminés conservés sont colorés par le niveau de conservation (seuil > 50%). La séquence de référence est marquée en violet. b Alignement des nouveaux domaines « riches en Cys ». Les cases indiquent deux motifs de cystéine, les acides aminés sont colorisés par le pourcentage Schéma de coloration de l’identité

Eglin-like

Les églines sont de petites protéines sans cystéine qui appartiennent à la famille I13 des inhibiteurs de protéinases à sérine . Les églines des sangsues ont une activité inhibitrice contre les élastases neutrophiles et les cathepsines G et aussi pour participer à la protection du contenu des cultures contre une protéolyse intempestive . A noter que les séquences identifiées dans la présente étude présentent une faible homologie avec l’égline classique de la sangsue Fig. 6a.

Fig. 6
figure6

a Alignement des séquences d’acides aminés des transcrits de type égline avec l’égline (Hirudo medicinalis, P01051), la protéine hypothétique (Helobdella robusta, xp_009019226.1) et l’homologue de l’inhibiteur de la chymotrypsine de la pomme de terre (Solanum tuberosum, P01052). L’alignement est généré par l’algorithme MUSCLE, les résidus sont colorés selon le schéma de couleurs de ClustalX. Les résidus identiques et conservés sont indiqués respectivement par un astérisque, un point et deux points. b Alignement des domaines PAN avec la protéine antiplaquettaire de la sangsue (Haementeria officinalis, Q01747) et la protéine antiplaquettaire putative (Haementeria vizottoi, A0A0P4VN18). Les acides aminés conservés sont colorés par le niveau de conservation (seuil > 75%). Les séquences de référence sont marquées en violet

Cystatine

Nous avons identifié une séquence de cystatine uniquement dans le protéome de H. verbana. Les cystatines sont de petites protéines inhibitrices des protéases à cystéine (cathepsines B, H, C, L, S) et sont souvent trouvées dans les sialotranscriptomes de diverses tiques . Chez les tiques, les cystatines jouent un rôle important dans les processus liés à la réponse immunitaire, à la régulation des cystéines protéases endogènes impliquées dans la digestion du sang et à la détoxification de l’hème. Le nématode Nippostrongylus brasiliensis utilise les cystatines pour échapper au système immunitaire de l’hôte .

Domaine PAN

Ce domaine est présent dans de nombreuses protéines, notamment les protéines sanguines plasminogène et facteur de coagulation XI . Le domaine PAN/pomme de la prékallikréine plasmatique est connu pour médier sa liaison au kininogène de haut poids moléculaire, et le domaine PAN/pomme du facteur XI se lie aux facteurs XIIa et IX, aux plaquettes, au kininogène et à l’héparine . On a découvert que la sécrétion de la glande salivaire de la sangsue H. officinalis contient la protéine antiplaquettaire de sangsue (LAPP), qui possède un domaine PAN et qui est impliquée dans l’hémostase. Cette protéine présente une affinité pour les collagènes I, III et IV et inhibe ainsi l’adhésion plaquettaire médiée par le collagène .

Alpha-2-macroglobuline (α2M)

L’α2M multifonctionnelle hautement conservée est impliquée dans l’inhibition d’une large gamme de protéases (sérine, cystéine, aspartique et métalloprotéases), interagit avec les cytokines et les hormones, et joue un rôle dans la chélation du zinc et du cuivre . Elle peut agir comme un inhibiteur de la plasmine, inhibant ainsi la fibrinolyse, mais dans certains cas, elle inhibe la coagulation en inactivant la thrombine et la kallikréine . Cette protéine serait non seulement impliquée dans les processus immunitaires de la sangsue, mais aussi un composant important de la sécrétion de la glande salivaire qui renforce les processus d’anticoagulation.

Molécules impliquées dans l’adhésion

Ficoline

Les ficolines sont un composant du système immunitaire inné et déclenchent une voie d’activation du complément dépendante des lectines . Chez les invertébrés, les ficolines sont impliquées dans la reconnaissance des composants de la paroi cellulaire bactérienne . Le domaine semblable au fibrinogène est présent dans des protéines ayant une affinité pour les érythrocytes, par exemple la tachylectine-5A (TL5A). La TL5A présente une forte activité hémagglutinante et antibactérienne en présence d’ions Ca2+. Dans les venins de reptiles, des protéines de type ficoline, la ryncoline (de Cerberus rynchops) et la veficoline-1 (UniProt : E2IYB3) (de Varanus komodoensis), sont présumées déclencher l’agrégation plaquettaire et la coagulation sanguine.

Domaine F5/8 de type C

Un certain nombre de séquences identifiées contiennent un ou plusieurs motifs discoïdine (DS), connus sous le nom de domaine F5/8 de type C. Ce domaine est présent dans de nombreuses protéines transmembranaires et extracellulaires, par exemple les neuropilines, la neurexine IV et les protéines réceptrices du domaine discoïdine, ainsi que dans des protéines impliquées dans l’hémostase, comme les facteurs de coagulation V et VIII . Le domaine DS joue un rôle important dans la liaison de diverses molécules ligand, notamment les phospholipides et les glucides. En raison de ces caractéristiques, les protéines contenant le domaine DS sont activement impliquées dans l’adhésion cellulaire, la migration, la prolifération et l’activation des cascades de signalisation. Les protéines contenant le domaine DS de la sangsue semblent agir comme des lectines à haute affinité pour le galactose et pourraient être des composants du système immunitaire inné de la sangsue. En outre, elles peuvent se lier au collagène ou à la phosphatidylsérine à la surface des plaquettes et de l’endothélium et ainsi, par inhibition compétitive, altérer les interactions entre les facteurs hémostatiques.

Famille a des récepteurs des lipoprotéines de basse densité

La famille des récepteurs des lipoprotéines de basse densité (LDLR) est un composant important du plasma sanguin et est impliquée dans la reconnaissance et l’endocytose des lipoprotéines de basse densité dans le sang des mammifères . Contrairement aux protéines homologues connues, ces récepteurs sont des protéines sécrétoires plutôt que membranaires, et ils contiennent quatre répétitions LDLR de classe A (riches en cystéine). Certains invertébrés, y compris les vers segmentés, sont supposés être incapables de synthétiser le cholestérol et les hormones stéroïdiennes, et pendant l’alimentation, les sangsues acquièrent le cholestérol principalement à partir du sang de l’hôte comme source exogène . Nous postulons que cette protéine peut être utilisée par la sangsue pour le piégeage et le transport de complexes lipoprotéiques riches en cholestérol.

Lectine de type R

Les protéines qui contiennent le domaine de la lectine bêta-troufoil de type ricine ont été trouvées chez les procaryotes et les eucaryotes. Chez les animaux, les lectines de type R présentent des activités diverses . Elles sont présentes dans les récepteurs scavenger (mannose, fucose, récepteurs du collagène), les N-acétylgalactosaminyltransférases, les toxines hémolytiques (CEL-III de Cucumaria echinata) et les cytotoxines induisant l’apoptose . Auparavant, des séquences similaires ont été identifiées dans les transcriptomes de sangsues ; cependant, les auteurs ont supposé que cette molécule avait une localisation mitochondriale. Un autre homologue proche remarquable est la lectine EW29 du ver de terre Lumbricus terrestris qui se lie au galactose. EW29 est constituée de deux domaines homologues et il a été démontré expérimentalement qu’elle présente une activité hémagglutinante. Comme de nombreuses lectines de type R connues sont impliquées dans l’adhésion et déclenchent l’hémolyse , cette molécule est intéressante pour une étude plus approfondie.

Domaine vWFA

Ce domaine est présent dans diverses protéines plasmatiques : facteurs du complément, intégrines et collagènes VI, VII, XII et XIV . Une protéine identifiée dans le protéome de la sangsue est une protéine sécrétée qui consiste en quatre copies du domaine vWFA Fig. 7. La séquence contient plusieurs sites de reconnaissance putatifs : le site d’adhésion dépendant des ions métalliques (MIDAS), le site de liaison intégrine-collagène et le site de liaison de la glycoprotéine Ib (GpIb). Selon l’analyse BlastX, ce domaine est homologue au collagène de type VI. Compte tenu de l’organisation en domaines de la protéine et de la présence de sites de liaison aux glycoprotéines et au collagène, l’un des mécanismes d’action putatifs consiste à se lier à la surface de l’endothélium ou des plaquettes, empêchant ainsi leur interaction avec le collagène. Cette liaison sous-tend l’inhibition compétitive au cours de l’hémostase (piégeage des plaquettes) .

Fig. 7
figure7

Alignement des domaines vWFA d’hirudo avec le vWFA1 humain (EAW88814.1) et le vWFA1-like (Colubraria reticulata, SPP68597.1). L’alignement est généré par l’algorithme MUSCLE, les résidus sont colorés selon le schéma de couleurs de ClustalX. Les résidus identiques et conservés sont indiqués respectivement par un astérisque, un point et deux points. La séquence de référence est marquée en violet

.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.