L’histoire évolutive des insectes holométaboles déduite de la phylogénie basée sur le transcriptome et des données morphologiques complètes

La phylogénie d’Holometabola

Nous avons analysé un total de 1 343 gènes orthologues 1:1 (c’est-à-dire, groupes de séquences orthologues, également appelés groupes d’orthologues (OG)) et, en incluant également les données publiées, les données de 88 espèces au total (tableau 1). Les sept ensembles de données décisifs spécialement conçus que nous avons analysés pour répondre à nos sept questions phylogénétiques consistaient chacun en un sous-ensemble de taxons et de gènes de l’ensemble de données complet, à l’exception de l’ensemble de données 1 qui est identique à l’ensemble de données complet. Les sept questions, les groupes taxonomiques que nous avons sélectionnés comme pertinents pour répondre aux questions, et le nombre d’espèces et d’OG pour chaque ensemble de données sont présentés dans le tableau 2. Pour chaque ensemble de données, nous avons effectué 1) une reconstruction d’arbre ML, et 2) une cartographie de vraisemblance à quatre clusters (FcLM) (voir tableau 3). Les résultats sont résumés dans la figure 1 (voir le fichier supplémentaire 1 : Figures S1-S7 pour la présence et l’absence de gènes dans les ensembles de données, Fichier supplémentaire 2 : Figures S8-S15 pour les arbres phylogénétiques complets, et fichier supplémentaire 3 : Figures S17-S25 pour les résultats complets du FcLM).

Tableau 1 Espèces Holometabola, pour lesquelles les données ont été nouvellement séquencées
Tableau 2 Les sept ensembles de données, conçus pour aborder sept questions phylogénétiques
Tableau 3 Résultats FcLM
Figure 1
figure1

Cladogramme combiné et simplifié des relations entre insectes holométaboles, avec les autapomorphies sélectionnées pour les clades abordés dans cette étude. La topologie est tirée de l’arbre ML déduit de l’ensemble de données 1 (c’est-à-dire la matrice de données complète). (1) Le support bootstrap (BS) (en bas, en noir) est dérivé de 72 répliques bootstrap (critère bootstopping basé sur le MRE) de l’ensemble de données 1. (2) Les valeurs BS pour la relation phylogénétique spécifique (en bas, rouge) sont dérivées des inférences d’arbres ML des sept ensembles de données spécifiques décisifs 1 à 7. (3) Les valeurs de support relatif pour la relation phylogénétique spécifique (en haut) sont dérivées du Four-cluster Likelihood Mapping (FcLM) avec les sept ensembles de données spécifiques décisifs. Les apomorphies sont sélectionnées à partir des listes complètes des caractères du plan de base reconstruits (voir le fichier supplémentaire 4, chapitre 5).

L’analyse de l’ensemble de données 1 a donné les Hyménoptères comme groupe frère de tous les ordres holométaboliques restants à la fois dans la reconstruction de l’arbre ML et dans la FcLM (tableau 3, figure 1). Cette relation avait déjà été retrouvée dans plusieurs études sur des gènes multiples (par exemple, ), et sur la base de données sur le génome entier, mais avec un échantillonnage limité de taxons. Les analyses des données morphologiques publiées précédemment ont donné des résultats contradictoires, comme par exemple Hymenoptera + Mecopterida chez Beutel et Gorb contre Hymenoptera + les ordres holométaboliques restants chez Beutel et al. . Les problèmes potentiels d’artefacts topologiques dans ces analyses, causés par des réductions convergentes dans de nombreux systèmes de caractères morphologiques, ont été discutés en détail par Friedrich et Beutel et Beutel et al. Le placement des Hyménoptères comme groupe frère de tous les ordres holométaboliques restants implique que les synapomorphies présumées des Hyménoptères et des Mécoptères (par exemple, griffe unique des larves, plaque sitophore sclérifiée des adultes ; voir ) sont en fait des homoplasies.

Nos analyses de l’ensemble de données 2 ont donné des Neuropteroidea monophylétiques (c’est-à-dire, un clade comprenant les Neuropterida, les Coleoptera et les Strepsiptera) avec un soutien maximal dans la reconstruction de l’arbre ML et un fort soutien dans le FcLM (tableau 3, figure 1). Les Neuropteroidea n’ont pas été soutenus en tant que clade dans Beutel et al, mais ont été trouvés monophylétiques dans de nombreuses études précédentes, même si dans la plupart des cas avec un soutien faible ou sans soutien.

Nous n’avons pas trouvé de signal pour les Megaloptera paraphylétiques comme discuté par Beutel et al et Winterton et al (ensemble de données 3, tableau 3, figure 1). Au sein des Neuropterida, nos analyses ML ont soutenu au maximum une relation de groupe frère entre Raphidioptera et Neuroptera + Megaloptera, qui était également soutenue par plus de 2/3 de tous les quartets dans le FcLM (ensemble de données 4, tableau 3, figure 1). Les relations phylogénétiques entre les ordres de neuroptères ont fait l’objet de discussions controversées avec deux hypothèses alternatives : Raphidioptera + Megaloptera étant monophylétique (par exemple, ) ou Neuroptera + Megaloptera étant monophylétique (par exemple, ). Nos résultats soutiennent fortement cette dernière hypothèse.

L’analyse de l’ensemble de données 5 a donné des résultats ambigus en ce qui concerne un clade possible comprenant Coleoptera et Strepsiptera (Coleopterida) (tableau 3, figure 1). La résolution de ce problème de longue date est difficile en raison de la morphologie extrêmement modifiée (par exemple, ) et des caractéristiques génomiques distinctement dérivées des Strepsiptera endoparasites (« le problème des Strepsiptera », ; « insectes de l’espace », ). Dans les contributions les plus récentes, des preuves ont été trouvées pour un Coleopterida monophylétique (par exemple, ). Cependant, les études basées sur des données moléculaires sont restées ambiguës dans leurs résultats. Les Coleopterida n’étaient pas soutenus par tous les ensembles de données analysés par McKenna et Farrell . Les résultats de Wiegmann et al. étaient basés sur un ensemble relativement petit de gènes et n’ont montré qu’un faible soutien pour ce clade. Niehuis et al. ont analysé les séquences nucléotidiques du génome entier d’insectes holométaboles et ont trouvé des Coleopterida bien soutenus, mais l’échantillonnage des taxons n’incluait aucun ordre de neuroptères. Dans notre étude, Coleopterida est soutenu dans l’arbre ML (avec un soutien bootstrap maximal), mais pas dans les analyses FcLM (tableau 3, figure 1). Dans l’arbre ML, les Strepsiptera sont placés au sein des Coleoptera (comme dans certains arbres de McKenna et Farrell), mais avec des relations mal soutenues (Additional file 2 : Figure S12). Nous avons également analysé si l’incongruence entre la reconstruction d’arbre ML et les analyses FcLM disparaissait en considérant des analyses ML et FcLM partitionnées utilisant différents modèles sur différentes partitions. Les analyses partitionnées pourraient réduire les erreurs potentielles de spécification des modèles et produire des topologies congruentes. Cependant, l’incongruence entre les analyses ML et FcLM n’a pas disparu (tableau 3, fichiers supplémentaires 2 et 3). Cela implique que les erreurs de spécification du modèle dues aux analyses non partitionnées ne sont pas la source de l’incongruence (voir également la discussion dans ce document). Apparemment, les données et les procédures analytiques de notre étude n’ont pas permis de résoudre sans ambiguïté la question de savoir si les Coleopterida constituent ou non un groupe monophylétique. Cependant, les preuves provenant de la morphologie suggèrent clairement un Coleopterida monophylétique (voir aussi ) comme le résultat le plus plausible.

Afin de tester la monophylie des Mecopterida, un clade comprenant les Amphiesmenoptera (Lepidoptera + Trichoptera) et les Antliophora (Diptera + Siphonaptera + Mecoptera), nous avons analysé deux versions du jeu de données 6 pour tenir compte de deux hypothèses possibles (jeu de données 6a, b ; tableaux 2 et 3). Les deux analyses ont permis de retrouver des Mecopterida monophylétiques avec un fort soutien (Tableau 3, Figure 1). Le Mecopterida monophylétique, tel que proposé par Hinton sous le nom de Panorpoidea (ou complexe panorpoïde), n’était pas bien soutenu par Kjer et al. et Wiegmann et al. et seulement soutenu par les analyses bayésiennes des caractères morphologiques de Beutel et al. Niehuis et al. ont trouvé un soutien provisoire pour ce clade basé sur les données du génome entier, mais l’échantillonnage incomplet des taxons – les génomes des Neuropterida, Trichoptera, Siphonaptera et Mecoptera n’ont pas encore été séquencés – a diminué le caractère décisif de cet ensemble de données concernant la question du Mecopterida monophylétique.

Nos analyses ont clairement corroboré la monophylie des Amphiesmenoptera (Trichoptera + Lepidoptera) (Figure 1). Cependant, nous n’avons pas testé cette hypothèse à l’aide d’un ensemble de données spécifiquement conçu, car elle n’a jamais été sérieusement contestée.

Au sein d’Antliophora, qui a montré un soutien bootstrap maximal dans l’arbre ML, nous avons trouvé une relation de groupe sœur de Mecoptera et Siphonaptera, également avec un soutien bootstrap maximal et avec un soutien maximal dans le FcLM (ensemble de données 7, tableau 2, figure 1). Ce résultat corrobore les opinions avancées par Beutel et Gorb , McKenna et Farrell , et Wiegmann et al , bien que le clade Mecoptera + Siphonaptera ne soit pas bien soutenu dans cette dernière étude. Une relation de groupe sœur entre les Diptères et les Siphonaptères, telle qu’elle a été retrouvée dans Beutel et al. (, voir la discussion dans ce document) est hautement improbable sur la base de nos analyses.

Avec cette étude, nous ne contribuons pas à la question de savoir si les Mecoptera constituent un groupe monophylétique car une seule espèce, Nannochorista philpotti, faisait partie de notre échantillonnage de taxons. Cependant, les données morphologiques et les analyses de neuf gènes nucléaires suggèrent fortement que les Mecoptera forment effectivement un groupe monophylétique.

En résumé, nous avons inféré une colonne vertébrale phylogénétique solide d’Holometabola, avec trois clades méga-diverses supportées au maximum Hymenoptera, Neuropteroidea, et Mecopterida, avec environ 135 000, 370 000, et 300 000 espèces décrites, respectivement. Pour l’unité bien définie comprenant les Neuropteroidea et les Mecopterida, nous proposons le nom Aparaglossata (Figure 1). Ce nom fait référence à la perte des paraglosses, l’une des apomorphies les plus voyantes du groupe (voir ci-dessous et tableau 4).

Tableau 4 Sélection des caractères du plan de masse et des apomorphies d’Holometabola et des sous-groupes d’holométaboles dont les relations phylogénétiques ont été abordées dans cette étude et dont la monophylie a été confirmée

Notre compilation des ensembles de données de séquences moléculaires et notre conception de l’analyse phylogénétique présentent quelques différences majeures par rapport aux études antérieures sur la phylogénie d’Holometabola. Plus précisément, i) nous avons utilisé une quantité massive de données générées par le séquençage de nouvelle génération Illumina (tableau 1). ii) Nous avons assuré la décisivité de nos ensembles de données en concevant spécifiquement des ensembles de données pour chacune de nos sept questions de recherche (tableau 2) (voir ). Le caractère décisif signifie que tous les gènes inclus dans un ensemble de données sont couverts par au moins un représentant de tous les groupes taxonomiques qui sont pertinents pour la relation phylogénétique spécifique étudiée. Par conséquent, chaque ensemble de données a une couverture de 100% en termes de présence de gènes, en ce qui concerne les groupes taxonomiques pertinents. En assurant la décisivité, nous atténuons les effets potentiellement trompeurs des données manquantes. Les données manquantes peuvent conduire à l’inférence de topologies hautement soutenues mais erronées (voir ). iii) Nous avons effectué FcLM pour chacun de nos sept ensembles de données (tableau 3). Nous avons réimplémenté FcLM en RAxML pour faire face à ces matrices de données à grande échelle et avons complété la méthode par des scripts nouvellement écrits qui transforment les résultats respectifs en graphiques simplex 2D. Le support Bootstrap dans les arbres phylogénétiques est à lui seul peu concluant dans les analyses de très grands ensembles de données. FcLM est une méthode permettant d’identifier le support possible de topologies alternatives dans un ensemble de données, c’est-à-dire une méthode permettant d’afficher un signal incongru qui pourrait ne pas être observable dans les arbres phylogénétiques. Cette étude est la première à appliquer le FcLM à de grandes supermatrices phylogénomiques. Enfin, iv) nous avons vérifié que tous les ensembles de données ne contenaient pas de taxons rebelles. Les taxons rebelles sont des taxons qui occupent plusieurs positions phylogénétiques dans un ensemble d’arbres bootstrap. Ils diminuent la résolution et/ou le support, par exemple, lors de la construction d’arbres consensus bootstrap. L’élimination des taxons indésirables peut produire un arbre de consensus bootstrap plus informatif (voir le fichier supplémentaire 4, chapitre 4). Tous nos ensembles de données étaient exempts de rogues.

Avec une compilation d’ensembles de données telle que présentée ici (c’est-à-dire en extrayant le nombre maximal de gènes pouvant contribuer à la résolution de la relation phylogénétique en question), nous nous sommes également assurés que les topologies inférées n’étaient pas basées sur une sélection arbitraire de gènes par rapport à leur signal phylogénétique inhérent. Dell’Ampio et al. ont montré que la sélection des gènes – si elle n’est pas motivée par des considérations concernant la décisivité d’un ensemble de données – peut générer des arbres topologiquement différents qui peuvent néanmoins tous présenter un support élevé. En outre, Simon et al. ont montré que les gènes impliqués dans différentes voies biologiques peuvent soutenir différentes topologies pour une relation phylogénétique spécifique. On peut donc conclure que les arbres phylogénétiques déduits de l’étude d’un ensemble de quelques gènes seulement sont facilement biaisés et peuvent donc ne pas refléter l’arbre des espèces correct. Bien que la meilleure approche actuelle pour résoudre ce problème consiste à inclure la quantité maximale possible de données potentiellement informatives, nous devrons démêler davantage les facteurs contribuant aux incongruences topologiques dans les ensembles de données (voir également ).

Les études phylogénétiques exclusivement basées sur la morphologie (par exemple, ) ont également donné lieu à des regroupements problématiques dans certains cas. Les auteurs ont abordé et discuté les artefacts apparents qui étaient principalement causés par des réductions parallèles dans les complexes de caractères (par exemple, l’appareil de vol). Toutefois, les problèmes se sont avérés insolubles compte tenu des données et des procédures analytiques disponibles. Grâce à nos ensembles de données moléculaires, nous avons pu fournir des solutions fiables pour la plupart des relations phylogénétiques interordonnées au sein d’Holometabola (figure 1, et ci-dessus). Pour retracer les changements évolutifs au niveau phénotypique, nous avons utilisé l’ensemble de données morphologiques le plus complet actuellement disponible, comprenant 356 caractères de représentants de tous les ordres d’Holométaboles et de taxons hors groupe soigneusement sélectionnés. Les caractères ont été mis en correspondance avec la phylogénie basée sur le transcriptome selon une approche formelle (voir la section Méthodes pour plus de détails). Cela nous a permis de retracer et de réinterpréter les changements évolutifs de nombreux caractères et de réaliser des reconstructions du plan de base basées sur la méthode de parcimonie pour tous les clades de l’arbre (voir « L’évolution au sein d’Holométabole » ci-dessous).

L’évolution au sein d’Holometabola

Larves et développement

Nos résultats phylogénétiques suggèrent que la larve ancestrale d’Holometabola était terrestre, orthognathe, équipée d’yeux composés modérément simplifiés mais distinctement développés, et de pattes thoraciques bien développées. Les prolegs abdominaux et les cerques étaient absents (Figure 2). Le système musculaire était généralement bien développé. Les simplifications distinctes des antennes et des lobes de l’endite labial et des muscles associés sont des autapomorphies larvaires d’Holometabola. La tête orthognathe dans le plan de base suggère que les premières larves d’Holometabola se nourrissaient extérieurement de matériel végétal ou de champignons et ne creusaient pas dans le substrat ou ne pénétraient pas dans des crevasses étroites (par exemple, sous l’écorce).

Figure 2
figure2

Illustration de la larve reconstruite du plan de base d’Holometabola. La larve putative du plan de base était orthognathe, et équipée d’yeux composés simplifiés mais distinctement développés, et de pattes thoraciques bien développées. Les prolegs abdominaux et les cerques étaient absents. Pour une liste des caractères du plan de base des larves et des adultes de Holometabola, voir le Tableau 4. ce : œil composé. fro : frons. ant : antenne. cl : clypeus. lbr : labrum. md : mandibule. mx : maxille. lb : labium. t1 : tergite du premier segment thoracique. pl1 : pleurite du premier segment thoracique. spi2 : spiracle du deuxième segment thoracique. plr : crête pleurale. cx : coxa. tr : trochanter. fe : fémur. tib : tibia. ta : tarse. cla : griffe. spiI : spiracle du premier segment abdominal. sV : sternite du cinquième segment abdominal. spiVIII : spiracle du huitième segment abdominal. tX : tergite du dixième segment abdominal.

La larve ancestrale d’aparaglossatan était probablement prognathe et équipée de stemmata. On ne sait toujours pas si ces larves étaient de type campodéidés agiles, comme les larves de nombreux coléoptères (par exemple, Adephaga, Myxophaga , Staphylinoidea), Strepsiptera (premier stade), Neuropterida, et certains groupes de Trichoptères (par exemple, Rhyacophilidae). Il est concevable que ce type larvaire soit une condition apomorphique caractérisant les Neuropteroidea, avec une évolution parallèle chez les Trichoptera. Le prognathisme est souvent lié à des habitudes alimentaires carnivores (Neuropterida, Adephaga, et certains sous-groupes polyphages), mais peut également être lié à la pénétration de crevasses étroites ou à l’enfouissement dans des substrats, comme c’est le cas chez les larves associées au bois d’Archostemata (Coleoptera), mais également dans les premières lignées de lépidoptères (par exemple, ). Ainsi, il n’est pas clair si les larves ancestrales d’aparaglossates étaient prédatrices ou non. Les larves des Mecopterida présentent quelques simplifications (tentorium et segments antennaires), et une nette tendance à la réduction caractérise les larves des antliophores, notamment celles des Siphonaptera et des Diptera. Tous deux ont entièrement perdu leurs pattes thoraciques (nettement raccourcies chez les Mecoptera) et sont caractérisés par des simplifications des structures céphaliques, notamment du système musculaire . Cela reflète le cycle de vie larvaire très répandu chez Antliophora, les larves vivant dans la couche supérieure du sol, la litière de feuilles, les substrats humides ou différents plans d’eau, se nourrissant principalement de substrats mous ou de petites particules. L’importante question de savoir si les larves ancestrales d’Antliophora étaient terrestres (Lépidoptères, Mécoptères, Siphonaptères, Mécoptères excluant les Nannochoristidae, Diptères partim) ou aquatiques (Trichoptères, Nannochoristidae, Diptères partim) reste ambiguë.

Nos résultats phylogénétiques indiquent clairement qu’un développement holométabole typique avec des larves complètement dépourvues de bourgeons alaires externes (« insectes endoptérygotes ») et également dépourvues de cerques appartient au plan de base de Holometabola (voir aussi ). Les conditions caractérisant les larves primaires strepsiptères (segment abdominal XI et cerques présents) et les larves secondaires (bourgeons alaires externes reconnaissables comme des convexités externes) sont apparemment le résultat d’inversions, comme l’apparition précoce des futurs yeux composés (voir ). Les pupes largement immobilisées avec des mandibules immobilisées (pupa adectica) ont presque certainement évolué plusieurs fois indépendamment. Il semble probable qu’une pupe mobile avec des mandibules mobiles telle qu’elle est caractéristique des Raphidioptères soit ancestrale pour les Holométaboles même si cela n’est pas confirmé par une analyse formelle des caractères.

Adultes et dépôt des œufs

L’adulte ancestral des Holométaboles ne différait apparemment que légèrement du plan de base des néoptères (Néoptères : tous les insectes ailés sauf les Odonates et les Ephéméroptères). Les structures céphaliques, l’ensemble du système musculaire, l’appareil de vol et les structures abdominales ne semblent pas avoir été modifiés. Les apomorphies les plus profondes chez les insectes holométaboles adultes sont liées à l’invagination des sternites ptérothoraciques (par exemple, les méso- et métacoxes étroitement adjacents) . Nos données ne permettent pas une évaluation fiable des habitudes alimentaires ancestrales des adultes holométaboles, mais il est évident que l’alimentation au stade adulte a joué un rôle mineur par rapport à l’alimentation aux stades larvaires. Les exceptions à cette règle sont par exemple les coléoptères prédateurs (par ex, Dytiscidae et Carabidae) avec un développement postembryonnaire très rapide et des adultes à longue durée de vie.

Des transformations distinctes des caractères morphologiques caractérisent l’ascension des Aparaglossata : la réduction des lobes de l’endite labial (paraglossae), y compris les muscles, la modification distincte de l’ovipositeur orthoptéroïde, et peut-être le nombre réduit de tubules de Malpighian (également chez les Acercaria (vraies punaises, psocoptères, poux et apparentés)) . Nos résultats ne permettent pas une reconstruction sans ambiguïté de la condition ancestrale de l’appareil de vol pour Holometabola et Aparaglossata. Il semble plausible que des segments ptérothoraciques de taille approximativement égale (comme chez les Neuropterida, les premières lignées de lépidoptères et les Mecoptera) soient plésiomorphes pour les Aparaglossata, mais la reconstruction de l’état ancestral de ce caractère dans l’analyse formelle reste ambiguë. Comme nous l’avons souligné plus haut, la question de savoir si les Coleopterida constituent ou non un groupe monophylique n’est pas complètement réglée. Cependant, il semble plausible de supposer que le postéromotorisme n’a évolué qu’une seule fois chez un ancêtre commun aux Strepsiptera et aux Coleoptera, avec une série de caractéristiques connexes, telles que la réduction de la taille du mésothorax, une réduction distincte du système musculaire mésothoracique, et une taille accrue du métathorax. Un antéromotorisme distinct tel qu’il est présent chez les Hyménoptères, les Trichoptères, les Lépidoptères « supérieurs » et les Diptères est peut-être ancestral chez Holometabola, mais il est concevable que cette condition ait évolué (secondairement ?, voir ci-dessus) plusieurs fois indépendamment (par ex, segments ptérothoraciques de taille presque égale chez les Lépidoptères non glossoïdes).

Les mécanismes d’accouplement des ailes ont apparemment évolué indépendamment chez les Hyménoptères (hamuli comme autapomorphie de l’ordre, voir fichier additionnel 4, chapitre 5), les Trichoptères, les Lépidoptères et certaines familles de Neuroptères (des mécanismes différents apparaissent dans ces ordres).

Le mode primaire de dépôt des œufs chez Holometabola était très probablement endophytique, comme on peut le supposer pour le plan de base des Hyménoptères (« Symphyta »). On peut penser que ce mode de ponte est maintenu dans le plan de base des Neuropteroidea. Les Raphidioptères ont un ovipositeur modifié et allongé qu’ils utilisent pour déposer leurs œufs sous l’écorce ou dans la litière. Cela ressemble à la déposition des œufs telle qu’elle est supposée pour le plan de base des Holométaboles et des Hyménoptères ; cependant, il pourrait également s’agir d’un caractère dérivé. La réduction complète ou presque complète des éléments de l’ovipositeur primaire est une caractéristique des Mecopterida et est manifestement liée à la déposition superficielle des œufs ou à la ponte sur des substrats mous. Nos résultats confirment en grande partie un scénario évolutif pour le postabdomen femelle et la déposition des œufs, tel que décrit en détail dans Hünefeld et al. .

.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.