Fylogeneza Holometabola
Przeanalizowaliśmy łącznie 1,343 genów ortologicznych 1:1 (tj, grupy sekwencji ortologicznych, zwane również grupami ortologicznymi (OGs)), a dzięki uwzględnieniu również danych opublikowanych, dane z łącznie 88 gatunków (Tabela 1). Siedem specjalnie zaprojektowanych decydujących zestawów danych, które analizowaliśmy w celu odpowiedzi na siedem pytań filogenetycznych, składało się z podzbiorów taksonów i genów z kompletnego zestawu danych, z wyjątkiem zestawu 1, który jest identyczny z kompletnym zestawem danych. Siedem pytań, grupy taksonomiczne, które wybraliśmy jako istotne dla odpowiedzi na te pytania, oraz liczba gatunków i OG dla każdego zbioru danych są pokazane w Tabeli 2. Dla każdego zestawu danych przeprowadziliśmy 1) rekonstrukcję drzewa ML, oraz 2) mapowanie prawdopodobieństwa czterech klastrów (FcLM) (patrz Tabela 3). Wyniki są podsumowane na Rysunku 1 (patrz plik dodatkowy 1: Figury S1-S7 dla obecności i braku genów w zestawach danych, plik dodatkowy 2: Figury S8-S15 dla pełnych drzew filogenetycznych, oraz plik dodatkowy 3: Figury S17-S25 dla pełnych wyników FcLM).
Analiza zestawu danych 1 dała Hymenoptera jako grupę siostrzaną do wszystkich pozostałych rzędów holometabolicznych zarówno w rekonstrukcji drzewa ML, jak i FcLM (Tabela 3, Rysunek 1). Zależność ta została już potwierdzona w kilku badaniach z udziałem wielu genów (np. ), a także w oparciu o dane całego genomu, ale przy ograniczonym próbkowaniu taksonów. Wcześniej opublikowane analizy danych morfologicznych przyniosły sprzeczne wyniki, takie jak na przykład Hymenoptera + Mecopterida w Beutel i Gorb versus Hymenoptera + pozostałe rzędy holometabolan w Beutel et al. Potencjalne problemy artefaktów topologicznych w tych analizach, które wynikają z konwergentnych redukcji w wielu układach cech morfologicznych, zostały szczegółowo omówione przez Friedricha i Beutela oraz Beutela i in. Umieszczenie Hymenoptera jako grupy siostrzanej do wszystkich pozostałych rzędów holometabolan implikuje, że przypuszczalne synapomorfie Hymenoptera i Mecopterida (np. pojedynczy pazur u larw, sklerotyzowana płytka sitoforowa u osobników dorosłych; zob. ) są w rzeczywistości homoplazjami.
Nasze analizy zbioru danych 2 dały monofiletyczne Neuropteroidea (tj, klad obejmujący Neuropterida, Coleoptera i Strepsiptera) z maksymalnym wsparciem w rekonstrukcji drzewa ML i silnym wsparciem w FcLM (Tabela 3, Rysunek 1). Neuropteroidea nie uzyskała wsparcia jako klad w badaniach Beutela i in., ale została uznana za monofiletyczną w wielu wcześniejszych badaniach, choć w większości przypadków ze słabym wsparciem lub bez wsparcia.
Nie znaleźliśmy żadnego sygnału dla parafiletycznej Megaloptera, co zostało omówione przez Beutela i in. oraz Wintertona i in. (zestaw danych 3, Tabela 3, Rysunek 1). W obrębie Neuropterida nasze analizy ML maksymalnie wspierają relację grupy siostrzanej między Raphidioptera i Neuroptera + Megaloptera, która była również wspierana przez ponad 2/3 wszystkich kwartetów w FcLM (zestaw danych 4, tab. 3, ryc. 1). Relacje filogenetyczne wśród rzędów neuropterydów były przedmiotem kontrowersji z dwiema alternatywnymi hipotezami: Raphidioptera + Megaloptera będące monofiletycznymi (np., ) lub Neuroptera + Megaloptera będące monofiletycznymi (np., ). Nasze wyniki silnie wspierają tę drugą hipotezę.
Analiza zbioru danych 5 przyniosła niejednoznaczne wyniki w odniesieniu do możliwego kladu obejmującego Coleoptera i Strepsiptera (Coleopterida) (Tabela 3, Rysunek 1). Rozstrzygnięcie tego długotrwałego problemu jest trudne ze względu na niezwykle zmodyfikowaną morfologię (np. ) i wyraźnie pochodne cechy genomiczne endopasożytniczych Strepsiptera („the Strepsiptera problem”, ; „insects from outer space”, ). W większości ostatnich opracowań znaleziono dowody na monofiletyczność Coleopterida (np., ). Jednakże badania oparte na danych molekularnych pozostały niejednoznaczne w swoich wynikach. Coleopterida nie były wspierane przez wszystkie zestawy danych analizowane przez McKenna i Farrell . Wyniki Wiegmann i in. opierały się na stosunkowo niewielkim zestawie genów i wykazały jedynie słabe wsparcie dla tego kladu. Niehuis i in. przeanalizowali sekwencje nukleotydowe całego genomu owadów holometabolicznych i znaleźli dobrze wsparte Coleopterida, ale próbkowanie taksonów nie obejmowało żadnego rzędu neuropteridów. W naszych badaniach, Coleopterida są wspierane w drzewie ML (z maksymalnym wsparciem bootstrapowym), ale nie w analizach FcLM (Tabela 3, Rysunek 1). W drzewie ML, Strepsiptera są umieszczone w obrębie Coleoptera (podobnie jak w niektórych drzewach McKenna i Farrella), jednak ze słabo wspartymi relacjami (plik dodatkowy 2: Rysunek S12). Dalej analizowaliśmy, czy niezgodność między rekonstrukcją drzew ML a analizami FcLM zniknęła, rozważając partycjonowane analizy ML i FcLM, wykorzystujące różne modele na różnych partycjach. Analizy podzielone na partycje mogą zredukować potencjalne błędne specyfikacje modelu i mogą dać zgodne topologie. Jednak niezgodność między analizami ML i FcLM nie zniknęła (Tabela 3, pliki dodatkowe 2 i 3). Sugeruje to, że błędne specyfikacje modelu wynikające z analiz bez podziału nie są źródłem niezgodności (patrz również i dyskusja w tym dokumencie). Najwyraźniej dane i procedury analityczne naszego badania nie przyniosły jednoznacznego rozwiązania kwestii, czy Coleopterida są grupą monofiletyczną, czy też nie. Jednakże dowody z morfologii wyraźnie sugerują monofiletyczność Coleopterida (patrz też ) jako najbardziej prawdopodobny wynik.
Aby sprawdzić monofiletyczność Mecopterida, kladu obejmującego Amphiesmenoptera (Lepidoptera + Trichoptera) i Antliophora (Diptera + Siphonaptera + Mecoptera), przeanalizowaliśmy dwie wersje zestawu danych 6, by uwzględnić dwie możliwe hipotezy (zestaw danych 6a, b; tabele 2 i 3). W obu analizach uzyskano silne wsparcie dla monofiletycznych Mecopterida (Tabela 3, Rysunek 1). Monofiletyczna Mecopterida, zaproponowana przez Hintona pod nazwą Panorpoidea (lub kompleks panorampoidalny), nie była dobrze wspierana w analizach Kjera i in. oraz Wiegmanna i in. i wspierana jedynie w bayesowskich analizach cech morfologicznych w analizie Beutela i in. Niehuis i in. znaleźli nieśmiałe wsparcie dla tego kladu na podstawie danych całego genomu, ale niekompletny dobór taksonów – genomy Neuropterida, Trichoptera, Siphonaptera i Mecoptera nie zostały jeszcze zsekwencjonowane – zmniejszył decydujący wpływ tego zestawu danych na kwestię monofiletyczności Mecopterida.
Nasze analizy wyraźnie potwierdziły monofiletyczność Amphiesmenoptera (Trichoptera + Lepidoptera) (Ryc. 1). Jednak nie testowaliśmy tej hipotezy za pomocą specjalnie zaprojektowanego zestawu danych, ponieważ nigdy nie była ona poważnie kwestionowana
W obrębie Antliophora, która wykazała maksymalne wsparcie bootstrapowe w drzewie ML, znaleźliśmy siostrzaną relację grupową Mecoptera i Siphonaptera, również z maksymalnym wsparciem bootstrapowym i z maksymalnym wsparciem w FcLM (zestaw danych 7, Tabela 2, Rysunek 1). Wynik ten potwierdza poglądy przedstawione przez Beutel i Gorb, McKenna i Farrell oraz Wiegmann i in, choć w tym ostatnim badaniu klad Mecoptera + Siphonaptera nie był dobrze wspierany. Relacja grupy siostrzanej między Diptera i Siphonaptera, jak wynika z badań Beutel et al. (, patrz dyskusja tamże) jest wysoce nieprawdopodobna w oparciu o nasze analizy.
W niniejszym opracowaniu nie wnosimy wkładu do odpowiedzi na pytanie, czy Mecoptera są grupą monofiletyczną, ponieważ tylko jeden gatunek, Nannochorista philpotti, był częścią naszego próbkowania taksonów. Jednakże dane morfologiczne i analizy dziewięciu genów jądrowych silnie sugerują, że Mecoptera rzeczywiście tworzą monofiletyczną grupę.
Podsumowując, wyciągnęliśmy wniosek o solidnym filogenetycznym kręgosłupie Holometabola, z trzema maksymalnie wspartymi mega-różnorodnymi kladami Hymenoptera, Neuropteroidea i Mecopterida, z około 135 000, 370 000 i 300 000 opisanych gatunków, odpowiednio. Dla dobrze zdefiniowanej jednostki obejmującej Neuropteroidea i Mecopterida proponujemy nazwę Aparaglossata (ryc. 1). Nazwa ta odnosi się do utraty paraglossae, jednej z najbardziej rzucających się w oczy apomorfii tej grupy (patrz niżej i tab. 4).
Nasza kompilacja zbiorów danych sekwencji molekularnych i nasz projekt analizy filogenetycznej wykazują kilka istotnych różnic w porównaniu z wcześniejszymi badaniami filogenezy Holometabola. W szczególności, i) wykorzystaliśmy ogromną ilość danych wygenerowanych za pomocą sekwencjonowania następnej generacji Illumina (Tabela 1). ii) Zapewniliśmy decydujący charakter naszych zestawów danych poprzez specjalne zaprojektowanie zestawów danych dla każdego z naszych siedmiu pytań badawczych (Tabela 2) (patrz ). Decyzyjność oznacza, że wszystkie geny zawarte w zbiorze danych są pokryte przez co najmniej jednego przedstawiciela wszystkich grup taksonomicznych, które są istotne dla konkretnej badanej relacji filogenetycznej. Odpowiednio, każdy zbiór danych ma pokrycie 100% pod względem obecności genów, w odniesieniu do odpowiednich grup taksonomicznych. Poprzez zapewnienie decyzyjności, łagodzimy potencjalnie mylące efekty brakujących danych. Brakujące dane mogą prowadzić do wnioskowania o wysoko wspieranych, ale błędnych topologiach (patrz ). iii) Przeprowadziliśmy FcLM dla każdego z naszych siedmiu zbiorów danych (Tabela 3). Ponownie zaimplementowaliśmy FcLM w RAxML, aby poradzić sobie z tymi wielkoskalowymi macierzami danych i uzupełniliśmy metodę o nowo napisane skrypty, które mapują odpowiednie wyniki na dwuwymiarowe wykresy simpleksowe. Samo wsparcie bootstrapowe w drzewach filogenetycznych ma ograniczoną rozstrzygalność w analizach bardzo dużych zbiorów danych. FcLM jest metodą identyfikacji możliwego wsparcia dla alternatywnych topologii w zbiorze danych, tj. metodą wyświetlania niespójnego sygnału, który może nie być obserwowalny w drzewach filogenetycznych. Niniejsze badanie jest pierwszym, w którym zastosowano FcLM do dużych supermatryc filogenomicznych. Wreszcie, iv) sprawdziliśmy wszystkie zestawy danych pod kątem występowania taksonów nieuczciwych. Rogue taxa to taksony, które zajmują wiele pozycji filogenetycznych w zestawie drzew bootstrapowych. Zmniejszają one rozdzielczość i/lub wsparcie, na przykład podczas budowania drzew konsensusu bootstrapowego. Usunięcie rogues może dać bardziej informacyjne drzewo konsensusu bootstrap (patrz plik dodatkowy 4, rozdział 4). Wszystkie nasze zestawy danych były wolne od rogues.
Z kompilacją zestawów danych, jak przedstawiono tutaj (tj. Poprzez wyodrębnienie maksymalnej liczby genów, które mogą przyczynić się do rozwiązania danego związku filogenetycznego), zapewniliśmy również, że wywnioskowane topologie nie były oparte na arbitralnym wyborze genów w odniesieniu do ich nieodłącznego sygnału filogenetycznego. Dell’Ampio i in. wykazali, że selekcja genów – jeśli nie jest podyktowana względami dotyczącymi decydującego znaczenia zbioru danych – może generować topologicznie różne drzewa, które mimo to mogą wykazywać wysokie wsparcie. Co więcej, Simon i in. wykazali, że geny zaangażowane w różne ścieżki biologiczne mogą wspierać różne topologie dla określonej relacji filogenetycznej. Można zatem stwierdzić, że drzewa filogenetyczne wywnioskowane na podstawie badania jedynie zestawu kilku do kilkunastu genów są łatwo tendencyjne, a zatem mogą nie odzwierciedlać prawidłowego drzewa gatunkowego. Chociaż obecnie najlepszym podejściem do rozwiązania tego problemu jest włączenie maksymalnej możliwej ilości potencjalnie informacyjnych danych, będziemy musieli dalej rozróżniać czynniki przyczyniające się do topologicznych niezgodności w zestawach danych (patrz także ).
Badania filogenetyczne oparte wyłącznie na morfologii (np., ) również przyniosły problematyczne grupowanie w niektórych przypadkach. Autorzy zajęli się i przedyskutowali widoczne artefakty, które były spowodowane głównie przez równoległe redukcje kompleksów cech (np. aparatu lotu). Problemy te okazały się jednak nie do rozwiązania, biorąc pod uwagę dostępne dane i procedury analityczne. Dzięki naszym molekularnym zestawom danych byliśmy w stanie dostarczyć wiarygodnych rozwiązań dla większości międzyordialnych relacji filogenetycznych w obrębie Holometabola (Rysunek 1 i powyżej). Do śledzenia zmian ewolucyjnych na poziomie fenotypowym wykorzystaliśmy najobszerniejszy dostępny obecnie zestaw danych morfologicznych, obejmujący 356 cech przedstawicieli wszystkich rzędów Holometabola oraz starannie dobranych taksonów z grup zewnętrznych. Znaki te zostały zmapowane na filogenezę opartą na transkryptomie w sposób formalny (szczegóły w rozdziale Metody). Pozwoliło nam to na prześledzenie i reinterpretację zmian ewolucyjnych wielu cech oraz na przeprowadzenie opartych na parsymfonii rekonstrukcji planu podstawowego dla wszystkich kladów drzewa (patrz „Ewolucja w obrębie Holometabola” poniżej).
Ewolucja w obrębie Holometabola
Larwy i rozwój
Nasze wyniki filogenetyczne sugerują, że ancestralna larwa Holometabola była lądowa, ortognatyczna, wyposażona w umiarkowanie uproszczone, ale wyraźnie rozwinięte oczy złożone i dobrze rozwinięte odnóża piersiowe. Kończyny brzuszne i cerci były nieobecne (ryc. 2). Układ mięśniowy był ogólnie dobrze rozwinięty. Wyraźne uproszczenia czułków i płatów wargowych oraz związanych z nimi mięśni są autapomorfiami larwalnymi Holometabola. Ortognatyczna głowa w planie sugeruje, że najwcześniejsze larwy Holometabola żerowały zewnętrznie na materiale roślinnym lub grzybach, a nie zagrzebywały się w podłożu lub penetrowały wąskie szczeliny (np. pod korą).
Przodkowa larwa aparaglossatan była prawdopodobnie prognatyczna i wyposażona w stemmaty. Nie wiadomo, czy larwy te należały do zwinnego typu campodeid, podobnie jak larwy wielu chrząszczy (np. Adephaga, Myxophaga , Staphylinoidea), Strepsiptera (pierwszy instar), Neuropterida i niektórych grup Trichoptera (np. Rhyacophilidae). Niewykluczone, że ten typ larwalny jest apomorficznym stanem charakteryzującym Neuropteroidea, z równoległą ewolucją u Trichoptera. Prognatyzm jest często związany z mięsożernymi nawykami żywieniowymi (Neuropterida, Adephaga i niektóre podgrupy polifagów), ale może być także związany z penetracją wąskich szczelin lub zagrzebywaniem się w podłożu, jak to ma miejsce u związanych z drewnem larw Archostemata (Coleoptera), ale także u wczesnych linii lepidoptera (np. ). Nie jest więc jasne, czy ancestralne larwy aparaglossatan były drapieżne, czy też nie. Larwy Mecopterida wykazują pewne uproszczenia (tentorium i segmenty antenalne), a wyraźna tendencja do redukcji cechuje larwy antropoforów, zwłaszcza Siphonaptera i Diptera. Oba gatunki całkowicie utraciły odnóża piersiowe (u Mecoptera wyraźnie skrócone) i charakteryzują się uproszczeniem struktur głowowych, zwłaszcza układu mięśniowego. Odzwierciedla to szeroko rozpowszechnioną u Antliophora larwalną historię życiową, z larwami żyjącymi w górnej warstwie gleby, ściółce liściowej, wilgotnym podłożu lub różnych zbiornikach wodnych, żywiącymi się głównie miękkim podłożem lub drobnymi cząstkami. Ważne pytanie, czy ancestralne larwy Antliophora były lądowe (Lepidoptera, Mecoptera, Siphonaptera, Mecoptera excl. Nannochoristidae, Diptera partim) czy wodne (Trichoptera, Nannochoristidae, Diptera partim) pozostaje niejednoznaczne.
Nasze wyniki filogenetyczne wyraźnie wskazują, że typowy rozwój holometaboliczny z larwami całkowicie pozbawionymi zewnętrznych pąków skrzydłowych („owady endopterygoty”), a także pozbawionymi cerci, należy do podłoża Holometabola (zob. też ). Warunki charakteryzujące pierwotne larwy strepsipteranów (XI segment brzuszny i obecne cerci) i larwy wtórne (zewnętrzne pąki skrzydłowe rozpoznawalne jako zewnętrzne wypukłości) są najwyraźniej wynikiem odwrócenia, jak wczesne pojawienie się perspektywicznych oczu złożonych (zob. ). Znacznie unieruchomione poczwarki z unieruchomionymi żuchwami (pupa adectica) prawie na pewno wyewoluowały kilka razy niezależnie od siebie. Wydaje się prawdopodobne, że ruchoma poczwarka z ruchomymi żuchwami, tak jak jest to charakterystyczne dla Raphidioptera, jest przodkiem Holometabola, mimo że nie potwierdza tego formalna analiza postaci.
Dorośli i składanie jaj
Przodek holometabolana, dorosły, najwyraźniej tylko nieznacznie różnił się od planu naziemnego neopteryksów (Neoptera: wszystkie owady uskrzydlone z wyjątkiem Odonata i Ephemeroptera). Struktury głowotułowia, cały układ mięśniowy, aparat lotu i struktury brzuszne wydają się w dużej mierze niezmienione. Najgłębsze apomorfie u dorosłych owadów holometabolicznych związane są z inwazyjnością mostków pterothorakalnych (np. ściśle przylegające do siebie mezo- i metacoxae). Nasze dane nie pozwalają na wiarygodną ocenę ancestralnych zwyczajów żywieniowych dorosłych holometabolanów, ale widać, że żerowanie w stadium dorosłym odgrywało niewielką rolę w porównaniu z żerowaniem w stadiach larwalnych. Wyjątkiem od tej reguły są np. drapieżne chrząszcze (np, Dytiscidae i Carabidae) o bardzo szybkim rozwoju postembrionalnym i długowiecznych osobnikach dorosłych.
Wyraźne zmiany cech morfologicznych charakteryzują powstanie Aparaglossata: redukcja płatów wargowych (paraglossae), w tym mięśni, wyraźna modyfikacja ortopteroidalnego ovipositora i prawdopodobnie zredukowana liczba kanalików Malpighiego (także u Acercaria (pluskwiaki, psocopterans, wszy i pokrewne)). Uzyskane przez nas wyniki nie pozwalają na jednoznaczną rekonstrukcję ancestralnego stanu aparatu latającego u Holometabola i Aparaglossata. Wydaje się prawdopodobne, że mniej więcej jednakowej wielkości segmenty pterothorakalne (jak u Neuropterida, wczesnych linii lepidoptera i Mecoptera) są plezjomorficzne dla Aparaglossata, ale rekonstrukcja stanu przodków tej cechy w analizie formalnej pozostaje niejednoznaczna. Jak wskazano wyżej, kwestia, czy Coleopterida to grupa monofiletyczna, czy nie, nie jest do końca rozstrzygnięta. Wydaje się jednak prawdopodobne, że posteromotoryka wyewoluowała tylko raz u wspólnego przodka Strepsiptera i Coleoptera, wraz z pakietem cech pokrewnych, takich jak redukcja rozmiarów mezotoraksu, wyraźna redukcja układu mięśni mezotorakalnych i zwiększenie rozmiarów metatoraksu. Wyraźny anteromotoryzm obecny u Hymenoptera, Trichoptera, „wyższych” Lepidoptera i Diptera jest prawdopodobnie przodkiem Holometabola, ale można sobie wyobrazić, że ten stan wyewoluował (wtórnie?, patrz wyżej) kilka razy niezależnie (np, prawie jednakowej wielkości segmenty pterothorakalne u niebłyskających Lepidoptera).
Mechanizmy łączenia skrzydeł najwyraźniej ewoluowały niezależnie u Hymenoptera (hamuli jako autapomorfia rzędu, patrz plik dodatkowy 4, rozdział 5), Trichoptera, Lepidoptera i niektórych rodzin Neuroptera (różne mechanizmy występują w tych rzędach).
Pierwotny sposób składania jaj u Holometabola był najprawdopodobniej endofityczny, jak można przypuszczać w przypadku rzędu Hymenoptera („Symphyta”). Ten sposób składania jaj jest prawdopodobnie zachowany w planie naziemnym Neuropteroidea. Raphidioptera posiadają zmodyfikowany, wydłużony ovipositor, za pomocą którego składają jaja pod korą lub w ściółce. Przypomina to składanie jaj, jak przyjęto u Holometabola i Hymenoptera; może to być jednak także cecha pochodna. Całkowita lub prawie całkowita redukcja elementów pierwotnego ovipositora jest cechą charakterystyczną dla Mecopterida i w oczywisty sposób wiąże się z powierzchownym składaniem jaj lub składaniem jaj w miękkim podłożu. Nasze wyniki w większości potwierdzają ewolucyjny scenariusz dla postabdomenu samicy i składania jaj, przedstawiony szczegółowo przez Hünefeld i in.