De fylogenie van Holometabola
We analyseerden in totaal 1.343 1:1 orthologe genen (d.w.z, groepen van orthologe sequenties, ook ortholog groepen (OG’s) genoemd) en, door ook gepubliceerde gegevens mee te nemen, gegevens van in totaal 88 soorten (Tabel 1). De zeven specifiek ontworpen beslissende datasets die we analyseerden om onze zeven fylogenetische vragen te beantwoorden, bestonden elk uit een subset van taxa en genen uit de volledige dataset, behalve dataset 1 die identiek is aan de volledige dataset. De zeven vragen, de taxonomische groepen die we selecteerden als relevant voor het beantwoorden van de vragen, en de aantallen soorten en OG’s voor elke dataset zijn weergegeven in Tabel 2. Voor elke dataset voerden we 1) ML boomreconstructie uit, en 2) Four-cluster Likelihood Mapping (FcLM) (zie Tabel 3). De resultaten zijn samengevat in Figuur 1 (zie Additional file 1: Figuren S1-S7 voor de aan- en afwezigheid van genen in de datasets, Additional file 2: Figuren S8-S15 voor de volledige fylogenetische bomen, en Aanvullend bestand 3: Figuren S17-S25 voor de volledige resultaten van de FcLM).
De analyse van dataset 1 leverde Hymenoptera op als zustergroep van alle resterende holometabolische ordes in zowel ML boomreconstructie als FcLM (tabel 3, figuur 1). Deze relatie was al eerder gevonden in verschillende multiple gen studies (e.g., ), en gebaseerd op volledige genoom gegevens maar een beperkte taxon steekproeftrekking. Eerder gepubliceerde analyses van morfologische gegevens leverden tegenstrijdige resultaten op, zoals bijvoorbeeld Hymenoptera + Mecopterida in Beutel en Gorb versus Hymenoptera + resterende holometabolische ordes in Beutel et al. . Mogelijke problemen van topologische artefacten in deze analyses, die veroorzaakt worden door convergente reducties in veel morfologische karakteristiekenystemen, werden in detail besproken door Friedrich en Beutel en Beutel et al. De plaatsing van Hymenoptera als zustergroep van alle resterende holometabolische ordes impliceert dat veronderstelde synapomorfieën van Hymenoptera en Mecopterida (b.v. enkele klauw van larven, gesclerotiseerde sitophore plaat van adulten; zie ) in feite homoplasieën zijn.
Onze analyses van dataset 2 leverden monofyletische Neuropteroidea op (d.w.z, een clade bestaande uit Neuropterida, Coleoptera, en Strepsiptera) met maximale ondersteuning in de ML boomreconstructie en sterke ondersteuning in de FcLM (tabel 3, figuur 1). Neuropteroidea werd in Beutel et al. niet als een clade ondersteund, maar werd in veel eerdere studies monofyletisch gevonden, hoewel in de meeste gevallen met zwakke of zonder ondersteuning.
Wij vonden geen signaal voor de parafyletische Megaloptera zoals besproken door Beutel et al. en Winterton et al. (dataset 3, Tabel 3, Figuur 1). Binnen de Neuropterida ondersteunden onze ML analyses maximaal een zustergroeprelatie tussen Raphidioptera en Neuroptera + Megaloptera, die ook ondersteund werd door meer dan 2/3 van alle kwartetten in de FcLM (dataset 4, Tabel 3, Figuur 1). De fylogenetische relaties tussen de neuroptera orden zijn controversieel besproken met twee alternatieve hypothesen: Raphidioptera + Megaloptera zijn monofyletisch (bijv. ) of Neuroptera + Megaloptera zijn monofyletisch (bijv. ). Onze resultaten ondersteunen de laatste hypothese sterk.
Analyse van dataset 5 leverde dubbelzinnige resultaten op met betrekking tot een mogelijke clade bestaande uit Coleoptera en Strepsiptera (Coleopterida) (tabel 3, figuur 1). Het oplossen van dit al lang bestaande probleem is moeilijk vanwege de extreem gewijzigde morfologie (bijv. ) en de duidelijk afgeleide genomische kenmerken van de endoparasitaire Strepsiptera (“het Strepsiptera-probleem”, ; “insecten uit de ruimte”, ). In de meeste recente bijdragen werden bewijzen gevonden voor monofyletische Coleopterida (b.v., ). De studies op basis van moleculaire gegevens bleven echter dubbelzinnig in hun resultaten. Coleopterida werden niet ondersteund door alle datasets die door McKenna en Farrell werden geanalyseerd. De resultaten van Wiegmann et al. waren gebaseerd op een relatief kleine set genen en toonden slechts zwakke ondersteuning voor deze clade. Niehuis et al. analyseerden hele genoom nucleotide sequenties van holometabolische insecten en vonden goed ondersteunde Coleopterida, maar de taxon steekproeftrekking omvatte geen enkele neuropteride orde. In onze studie wordt Coleopterida gesteund in de ML boom (met maximale bootstrap steun), maar niet in de FcLM analyses (Tabel 3, Figuur 1). In de ML-boom worden Strepsiptera binnen Coleoptera geplaatst (zoals in sommige bomen van McKenna en Farrell), echter met slecht ondersteunde relaties (Additional file 2: Figuur S12). We hebben verder geanalyseerd of de incongruentie tussen ML boomreconstructie en FcLM analyses verdween door gepartitioneerde ML en FcLM analyses te overwegen, waarbij verschillende modellen op verschillende partities werden gebruikt. Gepartitioneerde analyses zouden potentiële modelmispecificaties kunnen verminderen en zouden congruente topologieën kunnen opleveren. De incongruentie tussen ML en FcLM analyses verdween echter niet (Tabel 3, Additional files 2 en 3). Dit impliceert dat verkeerde modelspecificaties als gevolg van niet-gepartitioneerde analyses niet de bron van incongruentie zijn (zie ook en discussie daarin). Blijkbaar hebben de gegevens en analytische procedures van onze studie geen ondubbelzinnige oplossing opgeleverd voor de vraag of Coleopterida al dan niet een monofyletische groep is. Gegevens uit de morfologie wijzen echter duidelijk op een monofyletische Coleopterida (zie ook ) als het meest plausibele resultaat.
Om de monofyletie van Mecopterida te testen, een clade die bestaat uit Amphiesmenoptera (Lepidoptera + Trichoptera) en Antliophora (Diptera + Siphonaptera + Mecoptera), hebben we twee versies van dataset 6 geanalyseerd om rekening te houden met twee mogelijke hypotheses (dataset 6a, b; Tabellen 2 en 3). Beide analyses leidden tot monofyletische Mecopterida met sterke ondersteuning (Tabel 3, Figuur 1). Monofyletische Mecopterida, zoals voorgesteld door Hinton onder de naam Panorpoidea (of panorpoide complex), werd niet goed ondersteund in Kjer et al. en Wiegmann et al. , en alleen ondersteund in de Bayesiaanse analyses van morfologische kenmerken in Beutel et al. . Niehuis et al. vonden voorzichtige steun voor deze clade op basis van volledige genoomgegevens, maar de onvolledige taxonbemonstering – genomen van Neuropterida, Trichoptera, Siphonaptera, en Mecoptera zijn nog niet gesequenced – verminderde de doorslaggevendheid van deze dataset voor de vraag of Mecopterida monofyletisch is.
Onze analyses bevestigden duidelijk de monofylaxie van Amphiesmenoptera (Trichoptera + Lepidoptera) (Figuur 1). Wij hebben deze hypothese echter niet getest met een specifiek ontworpen dataset, omdat deze nooit serieus is betwist.
Binnen Antliophora, die maximale bootstrap steun in de ML boom vertoonde, vonden wij een zustergroep relatie van Mecoptera en Siphonaptera, ook met maximale bootstrap steun en met maximale steun in de FcLM (dataset 7, Tabel 2, Figuur 1). Dit resultaat bevestigt de standpunten van Beutel en Gorb , McKenna en Farrell , en Wiegmann et al. , hoewel de clade Mecoptera + Siphonaptera in laatstgenoemde studie niet goed gesteund werd. Een zustergroeprelatie tussen Diptera en Siphonaptera zoals gevonden in Beutel et al. (, zie de discussie daarin) is hoogst onwaarschijnlijk op basis van onze analyses.
Met deze studie leveren wij geen bijdrage aan de vraag of Mecoptera een monofyletische groep vormen, aangezien slechts één soort, Nannochorista philpotti, deel uitmaakte van onze taxonbemonstering. Morfologische gegevens en analyses van negen nucleaire genen suggereren echter sterk dat Mecoptera inderdaad een monofyletische groep vormen.
Samenvattend hebben we een solide fylogenetische ruggengraat van Holometabola afgeleid, met drie maximaal ondersteunde mega-diverse clades Hymenoptera, Neuropteroidea, en Mecopterida, met respectievelijk ongeveer 135.000, 370.000, en 300.000 beschreven soorten. Voor de goed gedefinieerde eenheid die de Neuropteroidea en Mecopterida omvat, stellen wij de naam Aparaglossata voor (Figuur 1). De naam verwijst naar het verlies van de paraglossae, een van de meest opvallende apomorfieën van de groep (zie verder en tabel 4).
Onze compilatie van moleculaire sequentie datasets en onze opzet van de fylogenetische analyse vertonen enkele belangrijke verschillen ten opzichte van eerdere studies over de fylogenie van Holometabola. Specifiek, i) we gebruikten een enorme hoeveelheid gegevens gegenereerd met Illumina Next Generation Sequencing (tabel 1). ii) We zorgden voor besluitvaardigheid van onze datasets door het specifiek ontwerpen van datasets voor elk van onze zeven onderzoeksvragen (tabel 2) (zie ). Slagvaardigheid betekent dat alle genen die in een dataset zijn opgenomen door ten minste één vertegenwoordiger van alle taxonomische groepen worden gedekt die relevant zijn voor de specifieke fylogenetische relatie die wordt bestudeerd. Bijgevolg heeft elke dataset een dekking van 100% in termen van aanwezigheid van genen, met betrekking tot de relevante taxonomische groepen. Door te zorgen voor een goede dekking, verminderen we de mogelijk misleidende effecten van ontbrekende gegevens. Ontbrekende gegevens kunnen leiden tot de gevolgtrekking van sterk ondersteunde, maar verkeerde topologieën (zie ). iii) We hebben FcLM uitgevoerd voor elk van onze zeven datasets (Tabel 3). We hebben FcLM opnieuw geïmplementeerd in RAxML om met deze grootschalige datamatrices overweg te kunnen en hebben de methode aangevuld met nieuw geschreven scripts die de respectieve resultaten in 2D simplexgrafieken in kaart brengen. Bootstrap-ondersteuning in fylogenetische bomen alleen is van beperkte overtuigingskracht in analyses van zeer grote datasets . FcLM is een methode om mogelijke steun voor alternatieve topologieën in een dataset te identificeren, d.w.z. een methode om incongruente signalen weer te geven die misschien niet waarneembaar zijn in fylogenetische bomen. Deze studie is de eerste die FcLM toepast op grote fylogenomische supermatrices. Tenslotte, iv) hebben we alle datasets gecontroleerd op malafide taxa. Rogue taxa zijn taxa die meerdere fylogenetische posities innemen in een set van bootstrap bomen. Zij verminderen de resolutie en/of de ondersteuning, bijvoorbeeld bij het bouwen van bootstrap consensusbomen. Het verwijderen van schurkenstaten kan een meer informatieve bootstrap consensusboom opleveren (zie Additional file 4, hoofdstuk 4). Al onze datasets waren vrij van schurken.
Met een compilatie van datasets zoals hier gepresenteerd (dat wil zeggen, door het extraheren van het maximale aantal genen dat kan bijdragen aan het oplossen van de fylogenetische relatie in kwestie) hebben we er ook voor gezorgd dat de afgeleide topologieën niet gebaseerd zijn op een willekeurige selectie van genen met betrekking tot hun inherente fylogenetische signaal. Dell’Ampio et al. toonden aan dat de selectie van genen – indien niet gedreven door overwegingen betreffende de besluitvaardigheid van een dataset – topologisch verschillende bomen kan genereren die niettemin allemaal een hoge ondersteuning kunnen vertonen. Bovendien toonden Simon et al. aan dat genen die betrokken zijn bij verschillende biologische paden verschillende topologieën kunnen ondersteunen voor een specifieke fylogenetische relatie. Men kan dus besluiten dat fylogenetische bomen die afgeleid worden uit de studie van slechts enkele tot enkele genen, gemakkelijk vertekend zijn en dus misschien niet de juiste soortboom weergeven. Hoewel de huidige beste aanpak van dit probleem is om de maximale haalbare hoeveelheid van potentieel informatieve gegevens op te nemen, zullen we de bijdragende factoren van topologische incongruenties in datasets verder moeten ontwarren (zie ook ).
Phylogenetische studies uitsluitend gebaseerd op morfologie (bijv. ) leverden in sommige gevallen ook problematische groeperingen op. De auteurs behandelden en bespraken schijnbare artefacten die hoofdzakelijk werden veroorzaakt door parallelle reducties in karaktercomplexen (b.v. het vliegapparaat). De problemen bleken echter onuitvoerbaar gezien de beschikbare gegevens en analytische procedures. Met onze moleculaire datasets waren we in staat om betrouwbare oplossingen te bieden voor de meeste interordinale fylogenetische relaties binnen Holometabola (Figuur 1, en hoger). Voor het opsporen van evolutionaire veranderingen op fenotypisch niveau hebben we gebruik gemaakt van de meest uitgebreide morfologische dataset die momenteel beschikbaar is, met 356 kenmerken van vertegenwoordigers van alle holometabolische ordes en van zorgvuldig geselecteerde outgroup taxa. De karakters werden op een formele manier in kaart gebracht op de transcriptoom-gebaseerde fylogenie (zie de Methoden sectie voor details). Dit stelde ons in staat om evolutionaire veranderingen van talrijke karakters te traceren en opnieuw te interpreteren en om op parsimony gebaseerde grondplanreconstructies uit te voeren voor alle clades van de boom (zie “De evolutie binnen Holometabola” hieronder).
De evolutie binnen Holometabola
Larven en ontwikkeling
Uw fylogenetische resultaten suggereren dat de voorouderlijke larve van Holometabola terrestrisch was, orthognathous, uitgerust met matig vereenvoudigde maar duidelijk ontwikkelde samengestelde ogen, en goed ontwikkelde thoracale poten. Abdominale proben en cerci waren afwezig (figuur 2). Het spierstelsel was over het algemeen goed ontwikkeld. Duidelijke vereenvoudigingen van de antennes en de labiale endietlobben met de bijbehorende spieren zijn larvale autapomorfieën van Holometabola. De orthognathale kop in het grondplan suggereert dat de vroegste holometabolalarven zich uitwendig voedden met plantenmateriaal of schimmels en zich niet ingroeven in substraat of binnendrongen in nauwe spleten (b.v. onder schors).
De voorouderlijke aparaglossatan-larve was waarschijnlijk prognathogeen en uitgerust met stemmata. Of deze larven van het beweeglijke campodeïde type waren, zoals de larven van vele kevers (b.v. Adephaga, Myxophaga , Staphylinoidea), Strepsiptera (eerste instar), Neuropterida, en sommige groepen van Trichoptera (b.v. Rhyacophilidae), blijft onduidelijk. Het is denkbaar dat dit larvale type een apomorfe conditie is die kenmerkend is voor Neuropteroidea, met parallelle evolutie bij Trichoptera. Prognathisme wordt vaak in verband gebracht met carnivore voedingsgewoonten (Neuropterida, Adephaga, en sommige polyphagische subgroepen), maar kan ook in verband gebracht worden met het binnendringen van nauwe spleten of het ingraven in substraten, zoals het geval is bij de met hout geassocieerde larven van Archostemata (Coleoptera), maar ook bij vroege lepidoptera (b.v. ). Het is dus onduidelijk of de voorouderlijke aparaglossatanlarven al dan niet roofzuchtig waren. Larven van Mecopterida vertonen enkele vereenvoudigingen (tentorium en antennale segmenten), en een duidelijke tendens tot verkleining kenmerkt antliophora larven, vooral die van Siphonaptera en Diptera. Beide hebben hun thoracale poten volledig verloren (duidelijk verkort bij Mecoptera) en worden gekenmerkt door vereenvoudigingen van de cephalische structuren, vooral van het spierstelsel. Dit weerspiegelt de wijdverbreide larvale levensgeschiedenis bij Antliophora, waarbij de larven leven in de bovenste bodemlaag, bladafval, vochtige substraten, of verschillende watermassa’s, en zich hoofdzakelijk voeden met zachte substraten of kleine deeltjes. De belangrijke vraag of de voorouderlijke Antliophora-larven terrestrisch (Lepidoptera, Mecoptera, Siphonaptera, Mecoptera excl. Nannochoristidae, Diptera partim) of aquatisch (Trichoptera, Nannochoristidae, Diptera partim) waren, blijft dubbelzinnig.
Onze fylogenetische resultaten geven duidelijk aan dat een typische holometabolische ontwikkeling met larven die geheel geen uitwendige vleugelknoppen hebben (“endopterygote insecten”) en ook geen cerci hebben, tot het grondplan van Holometabola behoort (zie ook ). De voorwaarden die kenmerkend zijn voor strepsipteraanse primaire larven (buiksegment XI en cerci aanwezig) en secundaire larven (uitwendige vleugelknoppen herkenbaar als uitwendige convexiteiten) zijn blijkbaar het resultaat van omkeringen, zoals het vroege verschijnen van de aanstaande samengestelde ogen (zie ). Grotendeels geïmmobiliseerde poppen met geïmmobiliseerde onderkaken (pupa adectica) zijn vrijwel zeker meerdere malen onafhankelijk van elkaar geëvolueerd. Het lijkt waarschijnlijk dat een beweeglijke pop met beweegbare onderkaken zoals die kenmerkend is voor Raphidioptera, ancestraal is voor Holometabola, ook al wordt dit niet bevestigd door een formele karakteranalyse.
Volwassenen en ei-afzetting
De voorouderlijke holometabolische volwassene verschilde kennelijk slechts in geringe mate van het neoptera grondplan (Neoptera: alle gevleugelde insecten behalve Odonata en Ephemeroptera). De cephalische structuren, het gehele spierstelsel, het vliegapparaat en de buikstructuren lijken grotendeels ongemodificeerd. De meest ingrijpende apomorfieën bij volwassen holometabolische insecten houden verband met de invaginatie van de pterothoracale sternieten (b.v. dicht naast elkaar liggende meso- en metacoxae) . Onze gegevens geven geen uitsluitsel over de voorouderlijke voedingsgewoonten van holometabolan-adulten, maar het is duidelijk dat voeding in het volwassen stadium een ondergeschikte rol speelde in vergelijking met voeding in de larvale stadia. Uitzonderingen op deze regel zijn b.v. roofkevers (b.v, Dytiscidae en Carabidae) met een zeer snelle postembryonale ontwikkeling en langlevende volwassenen.
Distinctieve morfologische karakterveranderingen kenmerken de opkomst van de Aparaglossata: de reductie van de labiale endietlobben (paraglossae), inclusief de spieren, de duidelijke modificatie van de orthopteroide ovipositor, en mogelijk het verminderde aantal Malpighian tubules (ook bij Acercaria (echte wantsen, psocoptera, luizen, en verwanten)) . Onze resultaten maken geen eenduidige reconstructie mogelijk van de voorouderlijke conditie van het vliegapparaat voor Holometabola en Aparaglossata. Het lijkt aannemelijk dat ongeveer even grote pterothoracale segmenten (zoals bij Neuropterida, vroege lepidoptera en Mecoptera) plesiomorf zijn voor Aparaglossata, maar de reconstructie van de voorouderlijke toestand van dit kenmerk in de formele analyse bleef ambigu. Zoals hierboven is opgemerkt, is de vraag of Coleopterida al dan niet een monofylic groep is, niet volledig beantwoord. Het lijkt echter aannemelijk om aan te nemen dat de postermotoriek slechts één keer is geëvolueerd in een gemeenschappelijke voorouder van Strepsiptera en Coleoptera, met een reeks verwante kenmerken, zoals de verkleining van de mesothorax, een duidelijke verkleining van het mesothoracale spierstelsel, en een grotere omvang van de metathorax. Een duidelijk anteromotorisme zoals dat voorkomt bij Hymenoptera, Trichoptera, “hogere” Lepidoptera en Diptera is mogelijk ancestraal bij Holometabola, maar het is denkbaar dat deze toestand zich (secundair?, zie boven) verscheidene keren onafhankelijk heeft ontwikkeld (b.v, bijna even grote pterothoracale segmenten bij niet-glanzende Lepidoptera).
Vleugelkoppelingsmechanismen zijn blijkbaar onafhankelijk geëvolueerd bij Hymenoptera (hamuli als een autapomorfie van de orde, zie Additional file 4, hoofdstuk 5), Trichoptera, Lepidoptera, en sommige families van Neuroptera (verschillende mechanismen komen in deze ordes voor).
De primaire wijze van ei-afzetting bij Holometabola was zeer waarschijnlijk endofytisch, zoals kan worden aangenomen voor de grondorde van Hymenoptera (“Symphyta”). Deze wijze van ei-afzetting wordt waarschijnlijk gehandhaafd in het grondplan van de Neuropteroidea. Raphidioptera hebben een gemodificeerde, langwerpige legboor waarmee ze eitjes afzetten onder schors of in het strooisel. Dit lijkt op ei-afzetting zoals verondersteld voor het grondplan van Holometabola en Hymenoptera; het zou echter ook een afgeleid kenmerk kunnen zijn. De volledige of bijna volledige reductie van elementen van de primaire ovipositor is een kenmerk van Mecopterida en houdt duidelijk verband met oppervlakkige ei-afzetting of ovipositie in zachte substraten. Onze resultaten bevestigen grotendeels een evolutionair scenario voor de vrouwelijke postabdomen en ei-afzetting zoals in detail uiteengezet in Hünefeld et al.