- Ensamblaje del genoma y anotación
- MRNA-seq, ensamblaje del transcriptoma y anotación
- Análisis de expresión diferencial
- Proteómica de la secreción de las células salivales
- Enzimas
- Proteasas
- Superóxido dismutasa (EC 1.15.1.1)
- Anhidrasa carbónica (EC 4.2.1.1)
- Hialuronidasa (EC 3.2.1.35)
- Apirasa (EC 3.6.1.5)
- La adenosina/AMP deaminasa (EC:3.5.4.4)
- Inhibidores de la proteinasa
- Antistasinas
- CAP/CRISP
- Eglin-like
- Cistatina
- Dominio PAN
- Alfa-2-macroglobulina (α2M)
- Moléculas implicadas en la adhesión
- Ficolina
- Dominio F5/8 tipo C
- Familia de receptores de lipoproteínas de baja densidad a
- Lectina de tipo R
- Dominio vWFA
Ensamblaje del genoma y anotación
Para ensamblar el genoma de H. medicinalis, extrajimos ADN de una sanguijuela adulta. Antes de ser procesada, la sanguijuela se mantuvo sin alimentarse durante al menos 2 meses. Creamos un conjunto de tres bibliotecas shotgun para realizar la secuenciación utilizando tres plataformas diferentes (Tabla Suplementaria 1). Se combinaron todos los conjuntos de datos de lecturas y se creó un único ensamblaje mediante SPAdes . El ensamblaje resultante contenía 168.624 contigs con una longitud de contig N50 de 12,9 kb (Tabla suplementaria 2).
El análisis preliminar (contigs BlastN) reveló la presencia de secuencias bacterianas en el ensamblaje resultante. Por lo tanto, realizamos un binning para discriminar los contigs de sanguijuelas (un bin de sanguijuelas). Construimos una distribución de contigs según su abundancia de GC, frecuencias de tetranucleótidos y cobertura de lectura. Para aumentar la precisión del binning, la cobertura de lectura se determinó combinando las lecturas de ADN con las lecturas correspondientes a un transcriptoma combinado de H. medicinalis (ver más abajo). La discriminación de los contigs eucariotas y procariotas se ilustra en la Fig. 1a/b, la Tabla Suplementaria 3 y los Datos Suplementarios 2. Además, seleccionamos los contigs mitocondriales para ensamblar el genoma mitocondrial de la sanguijuela .
Los contigs eucariotas se sometieron a un procedimiento de scaffolding utilizando lecturas emparejadas. Los andamios se generaron utilizando conjuntos de datos de lecturas emparejadas y de Illumina mediante SSPACE . Después del scaffolding, el ensamblaje consistió en 14.042 secuencias con una longitud de scaffold N50 de 98 kb (Tablas Suplementarias 4 y 5). La longitud del genoma de la sanguijuela se estima en 220-225 Mb. La longitud total del borrador del genoma ensamblado es de 187,5 Mbp, lo que corresponde al 85% del tamaño teórico del genoma de la sanguijuela (ver Tabla Suplementaria 6). Se predijo un total de 14.596 genes codificadores de proteínas.
Además, identificamos nuevos homólogos de genes que codifican anticoagulantes conocidos o proteínas relacionadas con la harina de sangre. Los alineamientos múltiples de aminoácidos para cada una de estas familias de proteínas (Figs. Suplementarias 1, 2) Basándonos en los datos de la secuencia del genoma y utilizando secuencias de proteínas conocidas, determinamos la organización de estos genes (Tabla Suplementaria 7, Fig. 1b). Las posiciones y longitudes de los exones e intrones se predijeron utilizando las respectivas secuencias de ADNc y proteínas como referencia. En algunos casos, los genes se localizan en andamios comunes y forman tándems o clusters Fig. 1b.
MRNA-seq, ensamblaje del transcriptoma y anotación
Para obtener muestras de mRNA específicas de tejido de tres especies de sanguijuelas medicinales, H. medicinalis, H. verbаna y H. orientalis, aislamos las células salivales y los músculos de las criosecciones de las partes anteriores del cuerpo usando microdisección láser (Fig. 2a). A continuación, construimos dos bibliotecas de ADNc con y sin normalización para cada muestra de ARNm utilizando el cebador oligo-dT y las secuenciamos en el Ion Torrent PGM (Tabla suplementaria 8). Se utilizaron cuatro conjuntos de datos de lecturas correspondientes a las bibliotecas de ADNc construidas para el ensamblaje de novo de un transcriptoma combinado para cada especie de sanguijuela medicinal utilizando el ensamblador de ARN Trinity (Tabla suplementaria 9). Utilizamos los transcriptomas combinados para mapear las lecturas específicas de los tejidos no normalizados. El mapeo de lecturas fue necesario para realizar el análisis de expresión diferencial consecutivo.
El análisis de la Ontología Genética (GO) de los transcritos detectados se realizó utilizando Blast2GO y BlastX. La base de datos ‘nr’ sirvió como base de datos de referencia. El análisis de GO demostró que las tres especies de sanguijuelas medicinales tenían distribuciones de transcritos similares en todas las categorías de GO (Figura Suplementaria 3). La distribución taxonómica de los resultados más cercanos de BlastX también fue similar (Figura Suplementaria 4). La mayoría de los transcritos identificados coincidían con dos especies de Annelida: El 59,8% con H. robusta y el 10,7% con C. teleta. Este análisis también confirmó la ausencia de contaminación por transcritos no sanguíneos.
La predicción de las regiones codificantes (o marcos de lectura abiertos, ORFs) y la anotación de los datos transcriptómicos se llevaron a cabo utilizando Transdecoder y Trinotate. Los ORF se tradujeron utilizando el algoritmo BlastP, y las secuencias proteicas se anotaron mediante la clasificación EuKaryotic Orthologous Groups (KOG) utilizando la base de datos eggNOG (Figura suplementaria 5). La clasificación KOG reveló que las tres especies de sanguijuelas medicinales tienen distribuciones de transcripción similares en las categorías KOG. Las tres especies de sanguijuelas medicinales también compartieron la gran mayoría de sus grupos ortólogos (Figura Suplementaria 6).
Análisis de expresión diferencial
Para estimar los niveles de expresión relativos de los transcritos identificados en las células salivales y en los músculos y para identificar los transcritos exclusivos de las células salivales, mapeamos las lecturas de ADNc específicas de cada tejido sin normalización contra el transcriptoma combinado de cada especie de sanguijuela medicinal. También hemos comparado las lecturas de ADNc específicas de los tejidos de H. medicinalis con el conjunto de su genoma. Los genes expresados diferencialmente se detectaron de acuerdo con un protocolo reciente. Para identificar los genes que se expresan diferencialmente en las células salivales y en los músculos, se construyó un gráfico MA individual para cada especie de sanguijuela medicinal utilizando su transcriptoma combinado (Fig. 2b, Figura Suplementaria 7). Se construyó un gráfico MA adicional para H. medicinalis utilizando su ensamblaje genómico (Fig. 2c). Los genes con un valor q (FDR) < 0,05 fueron considerados como expresados diferencialmente.
Identificamos 102, 174 y 72 transcripciones expresadas diferencialmente en las células salivales de H. medicinalis, H. orientalis y H. verbana, respectivamente. Dado que las tres son especies de sanguijuelas medicinales estrechamente relacionadas, las secuencias de proteínas de los transcritos expresados diferencialmente se agruparon en conjuntos ortólogos para simplificar el posterior análisis funcional. Identificamos 25 clusters ortólogos de expresión diferencial compartidos por tres especies de sanguijuelas y 44 clusters ortólogos compartidos por al menos dos especies de sanguijuelas (Fig. 3, Tablas Suplementarias 10-11). La mayoría de las secuencias en los grupos ortólogos identificados corresponden a proteínas hipotéticas anotadas en el genoma de H. robusta. El análisis de los dominios conservados en los clusters ortólogos identificados permitió determinar las secuencias pertenecientes a familias de proteínas conocidas.
También analizamos los genes diferencialmente expresados de H. medicinalis utilizando su ensamblaje genómico. Las lecturas de cDNA para las células salivales, los músculos y el tejido neural (las lecturas se obtuvieron del Archivo de Lecturas de Secuencia (SRA)) se mapearon en el ensamblaje del genoma. Para el tejido neural, se utilizó un conjunto de datos de lecturas para el ganglio 2 debido a su localización en los segmentos preorales. El análisis de expresión diferencial identificó 42 genes exclusivos de las células salivales de H. medicinalis (Tabla Suplementaria 12).
Proteómica de la secreción de las células salivales
Para el análisis proteómico, recogimos SCSs de tres especies de sanguijuelas medicinales, H. medicinalis, H. orientalis, y H. verbana, que se mantuvieron sin alimentación durante al menos 2 meses. El método de preparación de la muestra es crítico para el repertorio resultante de las proteínas identificadas porque el SCS consiste en componentes de bajo y alto peso molecular y contiene inhibidores de proteinasa, complejos de glicoproteínas y lípidos. Estos últimos pueden formar complejos con las proteínas. Por lo tanto, combinamos varios métodos de preparación de muestras y varias técnicas de espectrometría de masas para cubrir el más amplio repertorio de proteínas del SCS. Los conjuntos de datos proteómicos obtenidos por diferentes métodos de preparación de muestras y técnicas de espectrometría de masas se combinaron para crear una lista final de las proteínas identificadas para cada especie de sanguijuela medicinal.
Identificamos 189, 86 y 344 proteínas en los SCS de H. medicinalis, H. orientalis y H. verbana, respectivamente, y las agrupamos en conjuntos ortólogos como se ha descrito anteriormente. Se encontró que las tres especies de sanguijuelas medicinales compartían 39 clusters ortólogos, y 50 clusters ortólogos eran compartidos por al menos dos especies (Fig. 3, Tabla Suplementaria 13). La combinación de los datos transcriptómicos y proteómicos reveló 25 grupos ortólogos de genes expresados de forma única en las células salivales (Tabla Suplementaria 11). Una lista de los componentes individuales del SCS de la sanguijuela se da en la Fig. 3. Sorprendentemente, los genes que codifican los conocidos anticoagulantes del SCS y las proteínas relacionadas con la comida de la sangre no mostraron la expresión diferencial entre las células salivales y los músculos. Para validar este hallazgo, examinamos la expresión de la saratina, la eglina C, las bdellinas, la hirustasina, la desestabilasa, el inhibidor de la metalocarboxipeptidasa, la apirasa y la enzima convertidora de angiotensina (ECA) mediante la PCR en tiempo real de bibliotecas de ADNc adicionales e independientes, específicas para cada tejido, construidas para las células salivales y los músculos. Los resultados de la PCR en tiempo real para la hirudina y la desestabilasa (figura suplementaria 8) confirmaron este hallazgo. Esto indica que los genes que codifican los anticoagulantes y las proteínas relacionadas con la harina de sangre están implicados no sólo en la alimentación de la sangre, sino que contribuyen a otras funciones fisiológicas aún desconocidas.
A continuación, caracterizamos los componentes del SCS clasificados en grupos funcionales y describimos sus posibles papeles en la hemostasia. Las secuencias de las proteínas y su alineación se presentan en las Figs. suplementarias 9-24.
Enzimas
Proteasas
Los resultados de este estudio muestran que las metaloproteasas de las familias М12, M13 y M28 son los principales componentes enzimáticos del SCS. Las peptidasas M12B (ADAM/reprolysin) son una gran familia de metaloproteinasas similares a la desintegración que tienen una amplia gama de funciones y están involucradas en muchos procesos fisiológicos . Estas enzimas se encuentran a menudo en los venenos de serpiente, mientras que los transcritos se observan en los sialotranscriptomas de varias especies hematófagas . En la hemostasia, las proteasas secretadas de la familia М12 pueden participar en la inhibición de la adhesión de las plaquetas y en el ablandamiento del coágulo debido a la degradación del fibrinógeno. Estas proteínas presentan una actividad proteolítica dependiente de metales contra las proteínas de la matriz extracelular (gelatina, fibrinógeno, fibronectina), afectando así a la regulación de la inflamación y de las respuestas inmunitarias.
En los mamíferos, las proteasas de la familia M13 están implicadas en la formación y el desarrollo del sistema cardiovascular y en la regulación de los neuropéptidos en el sistema nervioso central . Una de sus funciones más importantes es la activación de péptidos biológicamente activos, en particular péptidos implicados en la regulación de la presión arterial (angiotensina y bradiquinina). En los mamíferos, la ECA es un componente importante del sistema renina-angiotensina (SRA). La ECA se expresa en los sialotranscriptomas de la sanguijuela (Theromyzon tessulatum), el caracol cono (Conidae), el caracol vampiro (Colubraria reticulata) y especies de dípteros (Diptera).
Las secuencias identificadas de las exopeptidasas de la familia M28 pertenecen a las carboxipeptidasas de tipo Q, también conocidas como dipeptidasas lisosomales o glutamato carboxipeptidasa plasmática (PGCP). Se ha demostrado que estas peptidasas están implicadas en la regulación del metabolismo de los péptidos secretados en el plasma sanguíneo y en el sistema nervioso central de los mamíferos. Estas enzimas parecen servir para desactivar ciertos péptidos de señalización en la sangre y son componentes de sistemas hemoglobinolíticos en parásitos hematófagos, desempeñando el papel de exopeptidasas digestivas . En particular, las secreciones de las glándulas salivales de las sanguijuelas contienen inhibidores de la carboxipeptidasa, que presumiblemente impiden la digestión intempestiva de la comida de la sangre por otros tipos de peptidasas.
Superóxido dismutasa (EC 1.15.1.1)
Hemos identificado secuencias de enzimas de la familia de la superóxido dismutasa secretada (SODC, tipo Cu/Zn). Esta familia de metaloproteínas es principalmente típica de los eucariotas y está implicada en la inactivación de los radicales libres, lo que retrasa los procesos oxidativos. En la sangre, la superóxido dismutasa cataliza la conversión de superóxido en oxígeno molecular y peróxido de hidrógeno y evita la formación de peroxinitrito y radicales hidroxilos . Curiosamente, el peroxinitrito puede suprimir la función hemostática mediante la nitración de procoagulantes clave , mientras que el peróxido de hidrógeno es una molécula de señalización clave que interviene en la regulación de muchos procesos (coagulación, trombosis, fibrinólisis, angiogénesis y proliferación). En las garrapatas, se supone que la SODC participa en la regulación de la colonización del tracto intestinal por bacterias, incluidos los agentes causantes de enfermedades . En los SCS, la SODC parece exhibir un efecto antibacteriano junto con otras proteínas del sistema inmunitario innato y evita la oxidación indeseada de la sangre durante la alimentación y la digestión. En particular, los compuestos que contienen hemo y el hierro libre están implicados en la formación de radicales libres y en la provocación del estrés oxidativo.
Anhidrasa carbónica (EC 4.2.1.1)
Esta enzima es un componente clave del sistema tampón de bicarbonato y está implicada en la regulación de los valores de pH en la sangre, el tracto digestivo y otros tejidos . En los animales hematófagos, esta enzima puede mantener las condiciones óptimas para la digestión de una comida de sangre . La anhidrasa carbónica parece causar un aumento local de la acidosis en el lugar de la mordedura, disminuyendo la actividad de los factores de coagulación de la sangre.
Hialuronidasa (EC 3.2.1.35)
Estas enzimas son comunes en los datos proteómicos y transcriptómicos de animales hematófagos y venenosos. Se sabe que las secreciones salivales de diferentes especies de sanguijuelas contienen hialuronidasa (heparinasa, orgelasa) . En el proteoma y el transcriptoma, encontramos tres grupos que contienen un dominio de la familia 79 de las glicosil hidrolasas (O-glicosil hidrolasas). Esta familia incluye las heparinasas, que desempeñan un papel importante en los tejidos conectivos. En los venenos y las secreciones de las glándulas salivales, estas enzimas catalizan la hidrólisis del ácido hialurónico, lo que provoca la pérdida de la integridad estructural de la matriz extracelular y facilita así la penetración de los anticoagulantes y otras moléculas activas en los tejidos. Además, la heparina de bajo peso molecular producida por la heparinasa suprime e inhibe la coagulación de la sangre.
Apirasa (EC 3.6.1.5)
Las apilasas son nucleotidasas implicadas en la degradación enzimática de ATP y ADP a AMP. Las apilasas secretadas y las 5′-nucleasas son componentes bien conocidos y caracterizados de las secreciones de las glándulas salivales de los animales venenosos y hematófagos, incluidas las sanguijuelas . Las apilasas son anticoagulantes porque eliminan el ADP, un importante inductor de la agregación plaquetaria en los sitios de lesión tisular.
La adenosina/AMP deaminasa (EC:3.5.4.4)
cataliza la desaminación hidrolítica de la adenosina para formar inosina. Las adenosina deaminasas están bien estudiadas y se han encontrado en la saliva de varios insectos hematófagos. La ADA también se encuentra en la secreción de la glándula salival del caracol vampiro C. reticulata, que pertenece a Spiralia, así como en las sanguijuelas . Se cree que el ADA desempeña un papel importante en la eliminación de la adenosina debido a su implicación en los procesos de percepción del dolor .
Inhibidores de la proteinasa
Antistasinas
Hemos identificado secuencias correspondientes al inhibidor de la proteinasa I15 (antistasina de la sanguijuela) Fig. 4. Las proteínas de esta familia se encuentran habitualmente en las sanguijuelas y desempeñan un papel clave en la inhibición de la coagulación de la sangre. Sus principales objetivos son las proteasas de serina que participan en la hemostasia, como el factor Xa, la calicreína, la plasmina y la trombina. Se ha demostrado que el ghilanten, una antistasina de Haementeria ghilianii, inhibe la agregación plaquetaria, y recientemente se ha informado de que la gigastasina de la sanguijuela gigante del Amazonas (Hementaria ghilianii) inhibe potentemente el complemento C1. La antistasina de Hementeria officinalis es el homólogo más cercano de las secuencias identificadas en nuestro estudio.
CAP/CRISP
La superfamilia de proteínas secretoras ricas en cisteína/antígeno 5/proteínas relacionadas con la patogénesis 1 (CAP) incluye numerosas familias de proteínas, en particular las proteínas secretoras ricas en cisteína (CRISP) Fig. 5a. Se encuentran comúnmente en los venenos de las serpientes y otros reptiles, y la mayoría de ellos son toxinas . En algunas investigaciones, se pensó que las CRISP de especies hematófagas estaban implicadas en la hemostasia (HP1). Las secuencias identificadas muestran similitud con secuencias de proteínas del nematodo parásito hematófago Ancylostoma caninum (anquilostoma), como el bloqueador del canal de potasio AcK1 y el posible inhibidor de la agregación plaquetaria HPI , así como con las toxinas de serpiente triflin (Protobothrops flavoviridis) y natrin-1 (Naja atra) . Entre los genes expresados diferencialmente, identificamos secuencias con un nuevo motivo «rico en Cys» Fig. 5b. Este grupo de proteínas se caracteriza por la presencia de un péptido señal y dos patrones de cisteína CX {5,14} CX {7} CX {8} СС {2} С y CX {7,17} CX {9} CX {8} СС {2} С.
Eglin-like
Las eglinas son pequeñas proteínas sin cisteína que pertenecen a la familia I13 de inhibidores de serina proteinasa . Las eglinas de las sanguijuelas tienen actividad inhibidora contra las elastasas de los neutrófilos y las catepsinas G y también para participar en la protección del contenido del cultivo de la proteólisis intempestiva . Cabe destacar que las secuencias identificadas en el presente estudio tienen poca homología con la eglina clásica de la sanguijuela Fig. 6a.
Cistatina
Hemos identificado una secuencia de cistatina sólo en el proteoma de H. verbana. Las cistatinas son pequeñas proteínas inhibidoras de cisteína proteasas (catepsinas B, H, C, L, S) y se encuentran a menudo en los sialotranscriptomas de varias garrapatas . En las garrapatas, las cistatinas desempeñan un papel importante en los procesos relacionados con la respuesta inmunitaria, la regulación de las cisteína-proteasas endógenas implicadas en la digestión de la sangre y la desintoxicación del hemo . El nematodo Nippostrongylus brasiliensis utiliza las cistatinas para evadir el sistema inmunitario del huésped.
Dominio PAN
Este dominio está presente en numerosas proteínas, incluidas las proteínas sanguíneas plasminógeno y factor de coagulación XI . Se sabe que el dominio PAN/manzana de la precalicreína plasmática media su unión al cininógeno de alto peso molecular, y el dominio PAN/manzana del factor XI se une a los factores XIIa y IX, a las plaquetas, al cininógeno y a la heparina . Se ha descubierto que la secreción de la glándula salival de la sanguijuela H. officinalis contiene la proteína antiplaquetaria de la sanguijuela (LAPP), que tiene un dominio PAN y está implicada en la hemostasia. Esta proteína muestra afinidad por los colágenos I, III y IV y, por tanto, inhibe la adhesión plaquetaria mediada por el colágeno.
Alfa-2-macroglobulina (α2M)
La altamente conservada y multifuncional α2M está implicada en la inhibición de una amplia gama de proteasas (serina, cisteína, aspártico y metaloproteasas), interactúa con citoquinas y hormonas y desempeña un papel en la quelación del zinc y el cobre. Puede actuar como inhibidor de la plasmina, inhibiendo así la fibrinólisis, pero en algunos casos, inhibe la coagulación inactivando la trombina y la calicreína . Se cree que esta proteína no sólo está implicada en los procesos inmunitarios de las sanguijuelas, sino que también es un componente importante de la secreción de las glándulas salivales que potencia los procesos de anticoagulación.
Moléculas implicadas en la adhesión
Ficolina
Las ficolinas son un componente del sistema inmunitario innato y desencadenan una vía de activación del complemento dependiente de la lectina . En los invertebrados, las ficolinas participan en el reconocimiento de los componentes de la pared celular bacteriana . El dominio similar al fibrinógeno está presente en proteínas con afinidad por los eritrocitos, por ejemplo, la taquilectina-5A (TL5A). TL5A presenta una fuerte actividad hemaglutinante y antibacteriana en presencia de iones Ca2+ . En los venenos de reptiles, las proteínas similares a la ficolina, la ryncolina (de Cerberus rynchops) y la veficolina-1 (UniProt: E2IYB3) (de Varanus komodoensis), se presume que desencadenan la agregación plaquetaria y la coagulación de la sangre.
Dominio F5/8 tipo C
Varias secuencias identificadas contienen uno o varios motivos de discoidina (DS), conocidos como dominio F5/8 tipo C. Este dominio está presente en numerosas proteínas transmembrana y extracelulares, por ejemplo, las neuropilinas, la neurexina IV y las proteínas receptoras del dominio discoidina, así como en proteínas implicadas en la hemostasia, como los factores de coagulación V y VIII . El dominio DS desempeña un papel importante en la unión de varias moléculas ligando, incluyendo fosfolípidos y carbohidratos . Debido a estas características, las proteínas que contienen DS participan activamente en la adhesión celular, la migración y la proliferación y activación de cascadas de señalización . Las proteínas que contienen dominios DS de la sanguijuela parecen actuar como lectinas con alta afinidad a la galactosa y pueden ser componentes del sistema inmunitario innato de la sanguijuela. Además, pueden unirse al colágeno o a la fosfatidilserina de la superficie de las plaquetas y del endotelio y, por tanto, por inhibición competitiva, perjudicar las interacciones entre los factores hemostáticos.
Familia de receptores de lipoproteínas de baja densidad a
La familia de receptores de lipoproteínas de baja densidad (LDLR) es un componente importante del plasma sanguíneo y participa en el reconocimiento y la endocitosis de las lipoproteínas de baja densidad en la sangre de los mamíferos . A diferencia de las proteínas homólogas conocidas, estos receptores son proteínas secretoras y no de membrana, y contienen cuatro repeticiones LDLR de clase A (ricas en cisteína). Se supone que algunos invertebrados, incluidos los gusanos segmentados, son incapaces de sintetizar el colesterol y las hormonas esteroides, y que durante la alimentación, las sanguijuelas adquieren el colesterol principalmente de la sangre del huésped como fuente exógena . Nosotros postulamos que esta proteína puede ser utilizada por la sanguijuela para la captación y el transporte de complejos lipoproteicos ricos en colesterol.
Lectina de tipo R
Las proteínas que contienen el dominio de la lectina beta-trefoil de tipo ricina se han encontrado en procariotas y eucariotas. En los animales, las lectinas de tipo R presentan diversas actividades . Están presentes en los receptores de carroña (manosa, fucosa, receptores de colágeno), en las N-acetilgalactosaminiltransferasas, en las toxinas hemolíticas (CEL-III de Cucumaria echinata) y en las citotoxinas inductoras de apoptosis. Anteriormente, se identificaron secuencias similares en los transcriptomas de las sanguijuelas; sin embargo, los autores asumieron que esta molécula tiene una localización mitocondrial . Otro homólogo cercano digno de mención es la lectina de unión a galactosa EW29 de la lombriz de tierra Lumbricus terrestris. La EW29 consta de dos dominios homólogos y se ha demostrado experimentalmente que presenta actividad hemaglutinante. Como muchas lectinas de tipo R conocidas están implicadas en la adhesión y desencadenan la hemólisis, esta molécula es interesante para un estudio más profundo.
Dominio vWFA
Este dominio está presente en varias proteínas plasmáticas: factores del complemento, integrinas y colágenos VI, VII, XII y XIV . Una proteína identificada en el proteoma de la sanguijuela es una proteína secretada que consta de cuatro copias del dominio vWFA Fig. 7. La secuencia contiene varios sitios de reconocimiento putativos: el sitio de adhesión dependiente de iones metálicos (MIDAS), el sitio de unión a la integrina-colágeno y el sitio de unión a la glicoproteína Ib (GpIb). Según el análisis BlastX, este dominio es homólogo al colágeno tipo VI. Teniendo en cuenta la organización de los dominios de la proteína y la presencia de sitios de unión a la glicoproteína y al colágeno, uno de los posibles mecanismos de acción implica la unión a la superficie del endotelio o de las plaquetas, impidiendo así su interacción con el colágeno. Esta unión subyace a la inhibición competitiva durante la hemostasia (barrido de plaquetas).