The phylogeny of Holometabola
Analysoimme yhteensä 1343 1:1 ortologista geeniä (ts., ortologisten sekvenssien ryhmiä, joita kutsutaan myös ortologisiksi ryhmiksi (ortholog groups, OGs)) ja, kun mukaan otettiin myös julkaistut tiedot, yhteensä 88 lajin tiedot (taulukko 1). Seitsemän erityisesti suunniteltua ratkaisevaa tietokokonaisuutta, joita analysoimme seitsemän fylogeneettisen kysymyksemme käsittelemiseksi, koostuivat kukin taksonien ja geenien osajoukosta täydellisestä tietokokonaisuudesta, lukuun ottamatta tietokokonaisuutta 1, joka on identtinen täydellisen tietokokonaisuuden kanssa. Seitsemän kysymystä, taksonomiset ryhmät, jotka valitsimme merkityksellisiksi kysymyksiin vastaamisen kannalta, sekä lajien ja OG:iden lukumäärät kussakin tietokokonaisuudessa on esitetty taulukossa 2. Kullekin tietokokonaisuudelle suoritettiin 1) ML-puun rekonstruktio ja 2) Four-cluster Likelihood Mapping (FcLM) (ks. taulukko 3). Tuloksista on yhteenveto kuvassa 1 (ks. lisätiedosto 1: Kuviot S1-S7 geenien läsnäolosta ja puuttumisesta aineistoissa, Additional file 2: Kuviot S8-S15 täydelliset fylogeneettiset puut ja kuvat S17-S25 FcLM:n täydelliset tulokset).
Datajoukon 1 analyysi tuotti Hymenopteran sisarryhmäksi kaikille jäljellä oleville holometabolialaisille järjestyksille sekä ML-puun rekonstruktiossa että FcLM:ssä (taulukko 3, kuva 1). Tämä sukulaisuussuhde oli jo havaittu useissa monigeenitutkimuksissa (esim. ), ja se perustui koko genomitietoihin mutta rajoitettuun taksoninäytteenottoon . Aiemmin julkaistut morfologisten tietojen analyysit antoivat ristiriitaisia tuloksia, kuten esimerkiksi Hymenoptera + Mecopterida Beutelissa ja Gorbissa vs. Hymenoptera + loput holometabolaariset järjestykset Beutel et al. Friedrich ja Beutel sekä Beutel et al. käsittelivät yksityiskohtaisesti topologisten artefaktien mahdollisia ongelmia näissä analyyseissä, jotka johtuvat monien morfologisten piirrejärjestelmien yhtenevistä reduktioista. Hymenopteran sijoittuminen sisäryhmäksi kaikille jäljellä oleville holometabolaarisille järjestyksille merkitsee sitä, että Hymenopteran ja Mecopteridan oletetut synapomorfiat (esim. toukkien yksittäinen kynsi, aikuisten sklerotisoitunut sitofoorilevy; ks. ) ovat itse asiassa homoplasioita.
Tietokokonaisuuden 2 analyysissämme saatiin tulokseksi monofyleettiset Neuropteroideat (ts, kladi, johon kuuluvat Neuropterida, Coleoptera ja Strepsiptera), jolla oli maksimaalinen tuki ML-puun rekonstruktiossa ja vahva tuki FcLM:ssä (taulukko 3, kuva 1). Neuropteroidea ei saanut tukea kladina Beutel et al:ssa , mutta se on todettu monofyleettiseksi monissa aiemmissa tutkimuksissa , vaikkakin useimmissa tapauksissa heikolla tai puuttuvalla tuella.
Emme havainneet mitään signaalia parafyleettiselle Megaloptera-kladille, kuten Beutel et al. ja Winterton et al. käsittelivät (aineisto 3, taulukko 3, kuva 1). Neuropteridan sisällä ML-analyysimme tukivat maksimaalisesti Raphidiopteran ja Neuropteran + Megalopteran välistä sisäryhmäsuhdetta, jota tuki myös yli 2/3 kaikista FcLM:n kvartaaleista (aineisto 4, taulukko 3, kuva 1). Neuropteridien järjestöjen välisiä fylogeneettisiä suhteita on käsitelty kiistanalaisesti kahden vaihtoehtoisen hypoteesin avulla: Raphidioptera + Megaloptera ovat monofyleettisiä (esim. ) tai Neuroptera + Megaloptera ovat monofyleettisiä (esim. ). Tuloksemme tukevat vahvasti jälkimmäistä hypoteesia.
Aineiston 5 analyysi tuotti epäselviä tuloksia mahdollisen Coleopteran ja Strepsipteran (Coleopterida) käsittävän kladin suhteen (taulukko 3, kuva 1). Tämän pitkäaikaisen ongelman ratkaiseminen on vaikeaa, koska endoparasiittisten Strepsiptera-suvun äärimmäisen muuntunut morfologia (esim. ) ja selvästi johdetut genomiset piirteet (”Strepsiptera-ongelma”, ; ”hyönteiset ulkoavaruudesta”, ). Viimeisimmissä kannanotoissa on löydetty todisteita monofyleettisistä Coleopterida-heimoista (esim., ). Molekyylitietoihin perustuvat tutkimukset jäivät kuitenkin tuloksiltaan epäselviksi. Kaikki McKennan ja Farrellin analysoimat tietokokonaisuudet eivät tukeneet Coleopterida-heimoa. Wiegmannin ym. tulokset perustuivat suhteellisen pieneen geenijoukkoon ja osoittivat vain heikkoa tukea tälle kladille. Niehuis et al. analysoivat holometabolisten hyönteisten koko genomin nukleotidisekvenssejä ja löysivät hyvin tukea Coleopteridoille, mutta taksoninäytteenotto ei sisältänyt yhtään neuropteridien järjestystä. Tutkimuksessamme Coleopterida saa tukea ML-puussa (maksimaalisella bootstrap-tuella), mutta ei FcLM-analyyseissä (taulukko 3, kuva 1). ML-puussa Strepsiptera sijoittuu Coleopteran sisälle (kuten joissakin McKennan ja Farrellin puissa ), kuitenkin heikosti tuetuin suhtein (lisätiedosto 2: kuva S12). Analysoimme edelleen, hävisivätkö ML-puun rekonstruktion ja FcLM-analyysien väliset epäjohdonmukaisuudet, kun otimme huomioon osioidut ML- ja FcLM-analyysit, joissa käytettiin eri malleja eri osioissa. Partitioidut analyysit saattaisivat vähentää mahdollisia mallien virhespesifikaatioita ja tuottaa yhteneväisiä topologioita. ML- ja FcLM-analyysien välinen epäjohdonmukaisuus ei kuitenkaan hävinnyt (taulukko 3, lisätiedostot 2 ja 3). Tämä viittaa siihen, että osiin jakamattomista analyyseistä johtuvat mallivirheet eivät ole inkongruenssin lähde (ks. myös ja siihen liittyvä keskustelu). Ilmeisesti tutkimuksemme aineisto ja analyysimenetelmät eivät tuottaneet yksiselitteistä ratkaisua kysymykseen, onko Coleopterida monofyleettinen ryhmä vai ei. Morfologian perusteella saadut todisteet viittaavat kuitenkin selvästi siihen, että monofyleettinen Coleopterida (ks. myös ) on uskottavin tulos.
Testataksemme Amphiesmenoptera (Lepidoptera + Trichoptera) ja Antliophora (Diptera + Siphonaptera + Mecoptera) -ryhmistä koostuvan Mecopterida-klaanin monofylisyyttä analysoimme kaksi versiota aineistosta 6 kahden mahdollisen hypoteesin huomioimiseksi (aineisto 6a, b; taulukot 2 ja 3). Molemmissa analyyseissä löydettiin monofylinen Mecopterida, jolla oli vahva tuki (taulukko 3, kuva 1). Hintonin nimellä Panorpoidea (tai panorpoidikompleksi) ehdottama monofyleettinen Mecopterida ei saanut hyvää tukea Kjer et al. ja Wiegmann et al. -analyyseissä, ja se sai tukea vain Beutel et al. -analyysien morfologisten merkkien Bayes-analyyseissä. Niehuis et al. löysivät tälle kladille alustavaa tukea koko genomitietoihin perustuen, mutta puutteellinen taksoninäytteenotto – Neuropterida-, Trichoptera-, Siphonaptera- ja Mecoptera-heimon genomeja ei ole vielä sekvensoitu – vähensi tämän aineiston ratkaisevuutta kysymyksessä monofyyttisestä Mecopterida-heimosta.
Omat analyysimme vahvistivat selvästi Amphiesmenoptera-heimon (Trichoptera + Lepidoptera) monofyyttisyyden (kuva 1). Emme kuitenkaan testanneet tätä hypoteesia erityisesti suunnitellulla aineistolla, koska sitä ei ole koskaan kiistetty vakavasti .
Antliophoran sisällä, joka osoitti maksimaalista bootstrap-tukea ML-puussa, löysimme Mecopteran ja Siphonapteran sisarryhmäsuhteen, jolla oli niin ikään maksimaalinen bootstrap-tuki ja jolla oli maksimaalinen tuki FcLM:ssä (aineisto 7, taulukko 2, kuva 1). Tämä tulos vahvistaa Beutelin ja Gorbin , McKennan ja Farrellin sekä Wiegmannin ym. esittämiä näkemyksiä, vaikka kladi Mecoptera + Siphonaptera ei saanut jälkimmäisessä tutkimuksessa kovin hyvää tukea. Sisarryhmäsuhde Diptera ja Siphonaptera välillä, kuten Beutel et al. ( , ks. keskustelu siinä) hakivat, on erittäin epätodennäköinen analyysiemme perusteella.
Tällä tutkimuksella emme osallistu kysymykseen siitä, ovatko Mecopterat monofyleettinen ryhmä, koska vain yksi laji, Nannochorista philpotti, oli osa taksoninäytteenottoamme. Morfologiset tiedot ja yhdeksän ydingeenin analyysit viittaavat kuitenkin vahvasti siihen, että Mecopterat todellakin muodostavat monofyleettisen ryhmän.
Yhteenvetona päättelimme Holometabolan vankan fylogeneettisen selkärangan, jossa on kolme maksimaalisesti tuettua megavaihtelevaa klaasia Hymenoptera, Neuropteroidea ja Mecopterida, joissa on vastaavasti noin 135 000, 370 000 ja 300 000 kuvattua lajia. Ehdotamme Neuropteroidean ja Mecopteridan muodostamalle hyvin määritellylle yksikölle nimeä Aparaglossata (kuva 1). Nimi viittaa paraglossaen puuttumiseen, joka on yksi ryhmän silmiinpistävimmistä apomorfioista (ks. jäljempänä ja taulukossa 4).
Molekyylisekvenssiaineistojen kokoamisessamme ja fylogeneettisen analyysin suunnittelussamme on joitain huomattavia eroja aiempiin Holometabolan fylogeneettisiin tutkimuksiin verrattuna. Erityisesti i) käytimme valtavaa määrää Illumina Next Generation Sequencing -menetelmällä tuotettua dataa (taulukko 1). ii) Varmistimme tietokokonaisuuksiemme ratkaisevuuden suunnittelemalla tietokokonaisuudet erityisesti kutakin seitsemää tutkimuskysymystämme varten (taulukko 2) (ks. ). Ratkaisukyky tarkoittaa, että kaikki tietokokonaisuuteen sisältyvät geenit kattavat vähintään yhden edustajan kaikista taksonomisista ryhmistä, jotka ovat merkityksellisiä tietyn tutkittavana olevan fylogeneettisen suhteen kannalta. Näin ollen kunkin tietokokonaisuuden kattavuus on 100 prosenttia geenien esiintymisen osalta asiaankuuluvien taksonomisten ryhmien osalta. Varmistamalla ratkaisevuuden lievennämme puuttuvien tietojen mahdollisesti harhaanjohtavia vaikutuksia. Puuttuvat tiedot voivat johtaa hyvin tuettujen mutta väärien topologioiden päättelyyn (ks. ). iii) Suoritimme FcLM:n jokaiselle seitsemälle tietokokonaisuudellemme (taulukko 3). Toteutimme FcLM:n uudelleen RAxML:ssä selviytyäksemme näistä suurista tietomatriiseista ja täydensimme menetelmää äskettäin kirjoitetuilla skripteillä, jotka kartoittavat vastaavat tulokset 2D-simpleksigraafeiksi. Pelkästään fylogeneettisten puiden Bootstrap-tuki on vain rajoitetusti ratkaisevaa hyvin suurten datajoukkojen analyyseissä . FcLM on menetelmä, jolla tunnistetaan mahdollinen tuki vaihtoehtoisille topologioille tietokokonaisuudessa, eli menetelmä, jolla näytetään epäjohdonmukainen signaali, joka ei ehkä ole havaittavissa fylogeneettisissä puissa. Tämä tutkimus on ensimmäinen, jossa FcLM:ää sovelletaan suuriin fylogenomisiin supermatriiseihin. Lopuksi iv) tarkistimme kaikki tietokokonaisuudet rogue-taksonien varalta. Konnataksonit ovat taksoneita, jotka omaksuvat useita fylogeneettisiä asemia bootstrap-puiden joukossa. Ne vähentävät resoluutiota ja/tai tukea esimerkiksi bootstrap-konsensuspuita muodostettaessa. Konnataksonien poistaminen voi tuottaa informatiivisemman bootstrap-konsensuspuun (ks. lisätiedosto 4, luku 4). Kaikissa tietokokonaisuuksissamme ei ollut konnia.
Tämässä esitetyllä tietokokonaisuuksien kokoamisella (eli poimimalla suurin mahdollinen määrä geenejä, jotka voivat vaikuttaa kyseisen fylogeneettisen suhteen ratkaisemiseen) varmistimme myös sen, että johdetut topologiat eivät perustu mielivaltaiseen geenien valintaan niiden luontaisen fylogeneettisen signaalin suhteen. Dell’Ampio et al. osoittivat, että geenien valinta – jos se ei perustu tietokokonaisuuden ratkaisevuuteen liittyviin näkökohtiin – voi tuottaa topologisesti erilaisia puita, joilla kaikilla voi kuitenkin olla korkea tuki. Lisäksi Simon et al. osoittivat, että eri biologisiin polkuihin osallistuvat geenit voivat tukea erilaisia topologioita tietylle fylogeneettiselle suhteelle. Näin ollen voidaan päätellä, että fylogeneettiset puut, jotka on johdettu tutkimalla vain muutamasta tai useammasta geenistä koostuvaa joukkoa, ovat helposti vääristyneitä eivätkä näin ollen välttämättä heijasta oikeaa lajipuuta. Vaikka tällä hetkellä paras lähestymistapa tämän ongelman ratkaisemiseksi on ottaa mukaan mahdollisimman suuri mahdollinen määrä potentiaalisesti informatiivista dataa, meidän on edelleen selvitettävä, mitkä tekijät vaikuttavat topologisten epäjohdonmukaisuuksien syntyyn tietokokonaisuuksissa (ks. myös ).
Yksinomaan morfologiaan perustuvat fylogeneettiset tutkimukset (esim. ) tuottivat joissakin tapauksissa myös ongelmallisia ryhmittelyjä. Kirjoittajat käsittelivät ja keskustelivat ilmeisistä artefakteista, jotka johtuivat pääasiassa hahmokompleksien (esim. lentolaite) rinnakkaisreduktioista. Ongelmat osoittautuivat kuitenkin vaikeasti ratkaistaviksi, kun otetaan huomioon käytettävissä olevat tiedot ja analyysimenetelmät . Pystyimme molekyylitietoaineistojemme avulla tarjoamaan luotettavia ratkaisuja useimmille interordinaalisille fylogeneettisille suhteille Holometabolan sisällä (kuva 1 ja edellä). Evoluutiomuutosten jäljittämiseksi fenotyyppisellä tasolla käytimme laajinta tällä hetkellä saatavilla olevaa morfologista aineistoa, joka sisälsi 356 merkkiä kaikkien holometabola-luokkien edustajilta ja huolellisesti valituilta ulkopuolisilta taksoneilta . Merkit kartoitettiin transkriptomipohjaiseen fylogeniaan muodollisella lähestymistavalla (ks. tarkemmat tiedot kohdasta ”Menetelmät”). Näin pystyimme jäljittämään ja tulkitsemaan uudelleen lukuisten merkkien evolutiivisia muutoksia ja suorittamaan parsimoniaan perustuvia pohjapiirrosrekonstruktioita kaikille puun kladeille (ks. jäljempänä ”Holometabolian sisäinen evoluutio”).
Evoluutio Holometabolan sisällä
Larva ja kehitys
Fylogeneettiset tuloksemme viittaavat siihen, että Holometabolan esi-isän toukka oli maanpäällinen, ortognaattinen, varustettu kohtalaisesti yksinkertaistetuilla mutta selvästi kehittyneillä yhdyssilmillä ja hyvin kehittyneillä rintajaloilla. Vatsan etujalat ja kerci puuttuivat (kuva 2). Lihaksisto oli yleisesti ottaen hyvin kehittynyt. Antennien ja labiaalisten endiittilohkojen ja niihin liittyvien lihasten selvä yksinkertaistuminen ovat Holometabolan toukkien autapomorfioita. Pohjakuvan ortognaattinen pää viittaa siihen, että varhaisimmat Holometabolan toukat söivät ulkoisesti kasvimateriaalia tai sieniä eivätkä kaivautuneet kasvualustaan tai tunkeutuneet kapeisiin rakoihin (esim. kuoren alle).