A filogenia de Holometabola
Analisamos um total de 1.343 genes ortológicos 1:1 (ou seja, grupos de sequências ortológicas, também chamados grupos ortológicos (OGs)) e, ao incluir também dados publicados, dados de um total de 88 espécies (Tabela 1). Os sete conjuntos de dados decisivos que analisamos para responder às nossas sete questões filogenéticas consistiram de um subconjunto de taxa e genes do conjunto de dados completo, exceto para o conjunto de dados 1, que é idêntico ao conjunto de dados completo. As sete questões, os grupos taxonômicos que selecionamos como relevantes para responder às questões, e os números de espécies e OGs para cada conjunto de dados são mostrados na Tabela 2. Para cada conjunto de dados realizamos 1) a reconstrução da árvore ML, e 2) o Mapeamento de Probabilidade de Quatro Meios (FcLM) (ver Tabela 3). Os resultados estão resumidos na Figura 1 (ver arquivo adicional 1: Figuras S1-S7 para presença e ausência de genes nos conjuntos de dados, arquivo Adicional 2: Figuras S8-S15 para as árvores filogenéticas completas, e arquivo adicional 3: Figuras S17-S25 para os resultados completos do FcLM).
>
A análise do conjunto de dados 1 produziu Hymenoptera como grupo irmão para todas as ordens holometabolan restantes tanto na reconstrução de árvores ML quanto no FcLM (Tabela 3, Figura 1). Esta relação já tinha sido recuperada em vários estudos genéticos múltiplos (por exemplo, ), e baseada em dados genómicos completos, mas com uma amostragem limitada de táxon . Análises publicadas anteriormente de dados morfológicos produziram resultados contraditórios, como por exemplo Hymenoptera + Mecopterida em Beutel e Gorb versus Hymenoptera + ordens holometabólicas remanescentes em Beutel et al. . Potenciais problemas de artefatos topológicos nestas análises que são causados por reduções convergentes em muitos sistemas de caráter morfológico foram discutidos em detalhes por Friedrich e Beutel e Beutel et al. . A colocação do Hymenoptera como grupo irmão para todas as ordens holometabólicas restantes implica que sinapomorfos presumidos de Hymenoptera e Mecopterida (por exemplo, uma única garra de larvas, placa de sitóforo esclerótica de adultos; ver ) são de facto homoplasias.
As nossas análises do conjunto de dados 2 produziram Neuropteroidea monofilética (ou seja, uma clade compreendendo Neuropterida, Coleoptera e Strepsiptera) com suporte máximo na reconstrução da árvore ML e forte suporte no FcLM (Tabela 3, Figura 1). Neuropteroidea não foi suportada como clade em Beutel et al. , mas foi encontrada monofilética em muitos estudos anteriores, embora na maioria dos casos com fraco ou sem suporte.
Não encontramos nenhum sinal para Megaloptera parafilética como discutido por Beutel et al. e Winterton et al. (conjunto de dados 3, Tabela 3, Figura 1). Dentro do Neuropterida, nossas análises ML suportaram ao máximo uma relação de grupo irmão entre Raphidioptera e Neuroptera + Megaloptera, que também foi suportada por mais de 2/3 de todos os quartetos no FcLM (conjunto de dados 4, Tabela 3, Figura 1). As relações filogenéticas entre as ordens neuropterídicas têm sido discutidas de forma controversa com duas hipóteses alternativas: Raphidioptera + Megalópteros sendo monofilético (e.g., ) ou Neuroptera + Megalópteros sendo monofilético (e.g., ). Os nossos resultados apoiam fortemente esta última hipótese.
Análise do conjunto de dados 5 produziu resultados ambíguos no que diz respeito a um possível clade compreendendo Coleoptera e Strepsiptera (Coleopterida) (Tabela 3, Figura 1). A resolução deste problema de longa data é difícil devido à morfologia extremamente modificada (por exemplo, ) e às características genómicas claramente derivadas do Strepsiptera endoparasitário (“o problema Strepsiptera”, ; “insectos do espaço exterior”, ). Nas contribuições mais recentes, foram encontradas evidências para a Coleopterida monofilética (e.g., ). Entretanto, os estudos baseados em dados moleculares permaneceram ambíguos em seus resultados. Os Coleopterida não foram apoiados por todos os conjuntos de dados analisados por McKenna e Farrell . Os resultados de Wiegmann et al. foram baseados em um conjunto relativamente pequeno de genes e mostraram apenas um fraco suporte para este clade. Niehuis et al. analisaram sequências de nucleotídeos do genoma inteiro de insetos holometabólicos e encontraram Coleopterida bem suportada, mas a amostragem do táxon não incluiu nenhuma ordem neuropterídica. Em nosso estudo, a Coleopterida é suportada na árvore ML (com suporte máximo de bootstrap), mas não nas análises FcLM (Tabela 3, Figura 1). Na árvore ML, Strepsiptera são colocados dentro da Coleoptera (como em algumas das árvores de McKenna e Farrell ), no entanto, com relações mal suportadas (arquivo adicional 2: Figura S12). Nós analisamos ainda se a incongruência entre a reconstrução da árvore ML e as análises FcLM desapareceu considerando as análises ML e FcLM particionadas usando modelos diferentes em partições diferentes. Análises particionadas podem reduzir possíveis erros de especificação de modelos e podem produzir topologias congruentes. Entretanto, a incongruência entre as análises ML e FcLM não desapareceu (Tabela 3, Arquivos adicionais 2 e 3). Isto implica que as informações errôneas de modelos devido a análises não particionadas não são a fonte da incongruência (ver também e discussão). Aparentemente, os dados e procedimentos analíticos do nosso estudo não produziram uma solução inequívoca para a questão de a Coleopterida ser ou não um grupo monofilético. No entanto, as evidências da morfologia sugerem claramente a Coleopterida monofilética (ver também ) como o resultado mais plausível. Nossas análises corroboraram claramente a monofila de Amphiesmenoptera (Trichoptera + Lepidoptera) (Figura 1). Entretanto, não testamos esta hipótese com um conjunto de dados especificamente desenhado porque nunca foi seriamente contestada . Com Antliophora, que mostrou suporte máximo de bootstrap na árvore ML, encontramos uma relação de grupo irmão de Mecoptera e Siphonaptera, também com suporte máximo de bootstrap e com suporte máximo no FcLM (conjunto de dados 7, Tabela 2, Figura 1). Este resultado corrobora as opiniões apresentadas por Beutel e Gorb , McKenna e Farrell , e Wiegmann et al. , embora o clade Mecoptera + Siphonaptera não tenha sido bem suportado no último estudo. Uma relação de grupo irmão entre Diptera e Siphonaptera, tal como foi resgatada em Beutel et al. (, ver discussão ali) é altamente improvável com base em nossas análises. Com este estudo, não contribuímos para a questão se Mecoptera é um grupo monofilético como apenas uma espécie, Nannochorista philpotti, fez parte de nossa amostragem de taxon. Entretanto, dados morfológicos e análises de nove genes nucleares sugerem fortemente que Mecoptera realmente forma um grupo monofilético. Em resumo, inferimos uma espinha dorsal filogenética sólida de Holometabola, com três clades mega-diversos com suporte máximo Hymenoptera, Neuropteroidea, e Mecopterida, com aproximadamente 135.000, 370.000, e 300.000 espécies descritas, respectivamente. Para a unidade bem definida que compreende Neuropteroidea e Mecopterida sugerimos o nome Aparaglossata (Figura 1). O nome refere-se à perda do paraglossae, uma das apomorfoses mais visíveis do grupo (ver abaixo e Tabela 4). A nossa compilação de conjuntos de dados de sequência molecular e o nosso desenho da análise filogenética apresentam algumas grandes diferenças em comparação com estudos anteriores sobre a filogenia de Holometabola. Especificamente, i) utilizamos uma grande quantidade de dados gerados com o Illumina Next Generation Sequencing (Tabela 1). ii) Garantimos a decisão dos nossos conjuntos de dados desenhando especificamente conjuntos de dados para cada uma das nossas sete questões de pesquisa (Tabela 2) (ver ). Decisividade significa que todos os genes incluídos em um conjunto de dados são cobertos por pelo menos um representante de todos os grupos taxonômicos que são relevantes para a relação filogenética específica em estudo. Assim, cada conjunto de dados tem uma cobertura de 100% em termos de presença de genes, com respeito aos grupos taxonômicos relevantes. Ao assegurar a determinação, aliviamos os efeitos potencialmente enganadores dos dados em falta. Dados em falta podem levar à inferência de topologias altamente suportadas mas erradas (ver ). iii) Realizamos FcLM para cada um dos nossos sete conjuntos de dados (Tabela 3). Reimplementamos o FcLM em RAxML para lidar com essas matrizes de dados em larga escala e complementamos o método com scripts recentemente escritos que mapeiam os respectivos resultados em gráficos simplex 2D. O suporte Bootstrap em árvores filogenéticas por si só é de conclusão limitada nas análises de conjuntos de dados muito grandes . O FcLM é um método para identificar possíveis suportes para topologias alternativas em um conjunto de dados, ou seja, um método para exibir sinais incongruentes que podem não ser observáveis em árvores filogenéticas. Este estudo é o primeiro a aplicar o FcLM em grandes supermercados filogenómicos. Finalmente, iv) verificamos todos os conjuntos de dados quanto à existência de taxas desonestas. Os táxons nocivos são táxons que assumem múltiplas posições filogenéticas em um conjunto de árvores bootstrap. Eles diminuem a resolução e/ou o suporte, por exemplo, ao construir árvores de consenso bootstrap. A remoção de malandros pode produzir uma árvore de consenso bootstrap mais informativa (ver arquivo adicional 4, Capítulo 4). Todos os nossos conjuntos de dados estavam livres de malandros. Com uma compilação dos conjuntos de dados aqui apresentados (isto é, extraindo o número máximo de genes que podem contribuir para a resolução da relação filogenética em questão) também garantimos que as topologias inferidas não se baseavam numa selecção arbitrária de genes com respeito ao seu sinal filogenético inerente. Dell’Ampio et al. mostraram que a selecção de genes – se não for motivada por considerações relativas à decisão de um conjunto de dados – pode gerar árvores topologicamente diferentes que podem, no entanto, apresentar um suporte elevado. Além disso, Simon et al. mostraram que genes envolvidos em diferentes vias biológicas podem suportar diferentes topologias para uma relação filogenética específica. Pode-se portanto concluir que as árvores filogenéticas inferidas a partir do estudo de apenas um conjunto de poucos a vários genes são facilmente tendenciosas e, portanto, podem não refletir a árvore da espécie correta. Embora a melhor abordagem actualmente para abordar este problema seja incluir a máxima quantidade possível de dados potencialmente informativos, teremos de separar ainda mais os factores contribuidores das incongruências topológicas nos conjuntos de dados (ver também ). Estudos filogenéticos exclusivamente baseados na morfologia (por exemplo, ) também produziram agrupamentos problemáticos em alguns casos. Os autores abordaram e discutiram artefatos aparentes que foram causados principalmente por reduções paralelas em complexos de caráter (por exemplo, o aparelho de vôo). No entanto, os problemas revelaram-se intratáveis, dados os dados e os procedimentos analíticos em questão. Com nossos conjuntos de dados moleculares fomos capazes de fornecer soluções confiáveis para a maioria das relações filogenéticas interordenais dentro da Holometabola (Figura 1, e acima). Para traçar alterações evolutivas a nível fenotípico utilizámos o conjunto de dados morfológicos mais extenso actualmente disponível, incluindo 356 caracteres de representantes de todas as ordens holometabolas e de táxis de grupos exteriores cuidadosamente seleccionados. Os caracteres foram mapeados para a filogenia baseada na transcrição numa abordagem formal (ver secção Métodos para mais detalhes). Isto permitiu-nos traçar e reinterpretar alterações evolutivas de numerosos caracteres e conduzir reconstruções da planta terrestre baseadas na parcimónia para todos os clades da árvore (ver “A evolução dentro de Holometabola” abaixo). Os nossos resultados filogenéticos sugerem que a larva ancestral de Holometabola era terrestre, ortognática, equipada com olhos compostos moderadamente simplificados mas distintamente desenvolvidos, e pernas torácicas bem desenvolvidas. Os prolegs abdominais e os cerci estavam ausentes (Figura 2). O sistema muscular estava geralmente bem desenvolvido. Simplificações distintas das antenas e lobos endídios labiais e músculos associados são autapomorfias larvares de Holometabola. A cabeça ortognática na planta do solo sugere que as primeiras larvas holometabolas se alimentavam externamente de material vegetal ou fungos e não enterradas em substrato ou penetrando em fendas estreitas (por exemplo, debaixo da casca).A evolução dentro de Holometabola
Larvas e desenvolvimento