FlyBase 2.0: a próxima geração

Abstract

FlyBase (flybase.org) é uma base de conhecimento que apoia a comunidade de investigadores que utilizam a mosca da fruta, Drosophila melanogaster, como um organismo modelo. A equipe do FlyBase cura e organiza um conjunto diversificado de informações genéticas, moleculares, genômicas e de desenvolvimento sobre a Drosophila. No início de 2018, o ‘FlyBase 2.0’ foi lançado com uma interface de usuário significativamente melhorada e novas ferramentas. Entre essas importantes mudanças estão uma nova organização dos resultados de pesquisa em listas ou tabelas interativas (hitlists), listas de referência melhoradas, e novos gráficos de domínio de proteínas. Uma nova classe de dados importante chamada ‘ferramentas experimentais’ consolida informações sobre linhagens úteis e outros recursos relacionados a um gene específico, o que aumenta significativamente a capacidade do pesquisador Drosophila de projetar e realizar experimentos. Com o lançamento do FlyBase 2.0, houve também uma reestruturação da arquitetura backend e um desenvolvimento contínuo das interfaces de programação de aplicações (APIs) para acesso programático aos dados do FlyBase. Nesta revisão, descrevemos essas novas características e funcionalidades principais do site FlyBase 2.0 e como elas suportam o uso de Drosophila como organismo modelo para descoberta biológica e pesquisa translacional.

INTRODUCTION

FlyBase (flybase.org) é o principal repositório e portal web para dados genéticos relacionados ao Drosophila melanogaster, a mosca-das-frutas. O Consórcio FlyBase é uma equipe de curadores, desenvolvedores e educadores em quatro sites: Universidade de Harvard, Universidade de Cambridge, Universidade de Indiana, e Universidade do Novo México. O FlyBase contém dados curados da literatura científica primária que cobrem mais de um século de pesquisa genética. Ao longo dos anos, o consórcio desenvolveu novos formatos de exibição de dados e novas ferramentas bioinformáticas para extrair esses dados para a descoberta biológica e pesquisa translacional. Estes esforços transformaram o FlyBase de um simples banco de dados em uma poderosa base de conhecimento.

O site do FlyBase passou por grandes mudanças desde nossa última revisão há dois anos (1). Em fevereiro de 2017, lançamos uma versão beta do site da próxima geração, que denominamos ‘FlyBase 2.0’. Após um período de feedback público e polimento, o FlyBase 2.0 substituiu o site anterior em dezembro de 2017. Nesta revisão, discutiremos o que é diferente e melhor sobre este website de próxima geração, e o que você pode esperar de uma visita ao novo e melhorado FlyBase 2.0, agora e no futuro. Embora nos concentremos nos novos dados e ferramentas desta revisão, houve algumas mudanças importantes na interface de usuário (UI) do FlyBase 2.0. Referimos o leitor interessado à revisão anterior do NAR em 2017 para uma extensa discussão de outros aspectos do FlyBase (1).

QuickSearch AND HITLISTS

As estatísticas de uso indicam que a maioria dos usuários consulta o FlyBase através de ‘QuickSearch’ na página inicial. Em agosto de 2017, o FlyBase adicionou a guia ‘GAL4 etc’ a ‘QuickSearch’. Esta pesquisa abordou uma necessidade antiga de uma forma administrável de pesquisar o FlyBase por GAL4 e outros drivers binários, bem como os relatórios lacZ e GFP, usando diferentes tipos de padrões de expressão. A busca retorna alelos, construções, inserções e estoques disponíveis, e tem a opção de exibir os resultados em grupos associados (Figura 1). Também sinaliza alguns dos mais populares drivers GAL4 com base nas informações de pedidos de estoque do BDSC, e o número de vezes que eles são referenciados em publicações (2). O separador ‘GAL4 etc’ também inclui um link para uma lista completa destes drivers GAL4 ‘frequentemente utilizados’.

Figure 1.

GAL4 Resultado da Pesquisa. Uma tabela de resultados para uma pesquisa usando a guia ‘GAL4 etc’ QuickSearch, com a opção de saída ‘tabela integrada’ selecionada. As referências cruzadas são usadas para agrupar alelos associados, construções, inserções e estoques em conjunto. Dois drivers GAL4 ‘frequentemente utilizados’ são sinalizados.

Figure 1.

GAL4 Resultado da Busca. Uma tabela de resultados para uma pesquisa usando a guia ‘GAL4 etc’ QuickSearch, com a opção de saída ‘tabela integrada’ selecionada. As referências cruzadas são usadas para agrupar alelos associados, construções, inserções e estoques em conjunto. Dois drivers GAL4 ‘frequentemente utilizados’ são assinalados.

Embora o QuickSearch tenha múltiplas abas para buscas específicas, a maioria das pessoas usa a aba genérica ‘Search FlyBase’. Dada a importância deste ponto de entrada, temos dedicado muito do nosso esforço para mudar e melhorar fundamentalmente as ‘hitlists’ retornadas por esta pesquisa para o FlyBase 2.0, aproveitando ao máximo a nova arquitetura do site (Figura 2). As melhorias de IU na página de resultados da lista de acertos incluem um layout ‘responsivo’ para visualização em telas pequenas (por exemplo, smartphones), paginação para reduzir os tempos de carregamento e um novo formulário de busca embutido.

Figure 2.

Search Result Hitlist. A página de resultados para Search FlyBase usando ‘Mad’ como o termo de busca. Uma ‘hitlist’ é exibida contendo genes, estoques, alelos e muitas outras classes de itens de dados do FlyBase (alguns não mostrados). O botão de relatório Mad gene é marcado com uma bandeira azul, indicando novas anotações no lançamento atual; mousing over the flag mostra um resumo. A lista é enquadrada com um array de ferramentas para filtragem por classe e espécie de dados, paginação, visualização e análise.

Figure 2.

Search Result Hitlist. A página de resultados para Search FlyBase usando ‘Mad’ como o termo de pesquisa. Uma ‘hitlist’ é exibida contendo genes, estoques, alelos e muitas outras classes de itens de dados do FlyBase (alguns não mostrados). O botão “Mad gene report” é marcado com uma bandeira azul, indicando novas anotações no lançamento atual; o mousing over the flag mostra um resumo. A lista é enquadrada com um array de ferramentas para filtragem por classe e espécie de dados, paginação, visualização e análise.

Uma característica significativa da nova lista de ocorrências é que ela é ‘mista’, que contém todas as classes de dados do FlyBase que correspondem ao termo de busca. Cada item correspondente está em um painel, contendo uma seleção concisa de informações importantes (Figura 2). Crachás com código de cores ao longo da margem direita permitem uma digitalização rápida dos itens por classe de dados (Figura 2). Uma bandeira azul indica que novos dados foram anexados a um item na versão mais recente do FlyBase (Figura 2). Os botões ligam-se a relatórios do FlyBase, navegadores do genoma, ou novas listas de acertos de itens relacionados, por exemplo, um painel para um determinado gene conterá botões para alelos associados, estoques, transcrições, polipéptidos e referências (Figura 2). Cada painel de classe de dados também contém informações específicas da classe; por exemplo, um painel de alelos irá exibir o mutagênico usado para gerar o alelo, quaisquer inserções associadas, e o número de declarações fenotípicas anexadas ao alelo.

A lista de acertos mista pode ser filtrada por espécie ou por classe de dados (Figura 2). O filtro de espécies permite que você escolha se deseja incluir/excluir transgenes humanos em moscas, bem como resultados não Melanogaster ou não-Drosophila. Os filtros da classe de dados podem ser definidos para exibir uma lista de acertos mais estreita, consistindo em algumas classes de dados de interesse, ou uma única classe de dados. A restrição dos resultados da pesquisa a uma única classe de dados desbloqueia ferramentas de classe única e opções de exibição. Note que a maioria dos separadores na ferramenta QuickSearch geram directamente listas de acertos de uma classe de dados.

Quando a lista de acertos é filtrada para uma única classe de dados, uma opção de visualização ‘Tabela’ torna-se disponível. A opção Table View é uma exibição de tabela verticalmente compacta, com colunas classificáveis apropriadas a essa classe (Figura 3). Um conjunto de ferramentas de análise torna-se disponível quando uma lista de acertos compreende uma única classe de dados. Essas ferramentas aparecem no topo da página de lista de acertos como uma linha de botões com o nome ‘Converter,’ ‘Exportar,’ e ‘Analisar’ (Figura 3). O botão Converter é alimentado pelas extensas referências cruzadas entre as classes de dados, permitindo, por exemplo, transformar uma lista de genes em uma lista de referências relacionadas, ou uma lista de alelos em uma lista de inserções associadas. O botão Exportar leva a atual lista de acertos para qualquer uma das várias ferramentas do FlyBase, tais como Batch Download ou Feature Mapper. Esta é também a melhor maneira de fazer o download de uma lista de acertos como um conjunto de IDs do FlyBase. O botão Analyze pode gerar vários tipos de relatórios curtos resumindo a lista de acertos, tais como frequências de termos de anatomia ou classes fenotípicas para uma lista de acertos de alelos, ou pode encaminhar a lista de acertos para a ferramenta Interactions Browser. Com estas melhorias, a lista de acertos tornou-se uma poderosa ferramenta para rever, refinar e analisar os resultados da pesquisa do FlyBase.

Figure 3.

Table View of Search Result Hitlist. A página de resultados da pesquisa ‘Mad’, filtrada para a classe de dados Allele e alternada para a vista de tabela. O menu da ferramenta Exportar foi expandido.

Figure 3.

Vista de tabela da lista de resultados da busca. A página de resultados da pesquisa ‘Mad’, filtrada para a classe de dados Allele e alternada para a vista de tabela. O menu da ferramenta Export foi expandido.

REPORT IMPROVEMENTS

Existiram várias alterações notáveis nos relatórios do FlyBase que melhoram a usabilidade e melhoram a exibição dos dados. Por exemplo, todos os relatórios agora incluem um painel de navegação no lado direito da página (Figura 4). Este painel contém links para todas as seções de nível superior no relatório e pode ser usado para saltar rapidamente para seções de interesse. A seção ‘Referências’ de todos os relatórios foi melhorada para facilitar a filtragem e classificação através de listas de publicações (veja a seção ‘Referências interativas e resumos gráficos’ abaixo para mais informações).

Figure 4.

FlyBase Gene Report. FlyBase Relatório Gene para o gene Cdk1. A seção de Informações Gerais serve como um ‘super sumário’ de informações genéticas. O menu ‘Seções de Relatório’ à direita flutua enquanto o usuário rola no relatório, fornecendo uma ferramenta de navegação fácil. A seção Localização Genômica inclui links externos para navegadores genômicos no NCBI, Ensembl, UCSC e PopFly.

Figure 4.

FlyBase Gene Report. FlyBase Gene Report para o gene Cdk1. A seção de Informações Gerais serve como um ‘super sumário’ de informações genéticas. O menu ‘Seções de Relatório’ à direita flutua enquanto o usuário rola no relatório, fornecendo uma ferramenta de navegação fácil. A seção de Localização Genômica inclui links externos para navegadores de genoma no NCBI, Ensembl, UCSC e PopFly.

A informação funcional resumida dos genes é importante para os usuários do nosso site, especialmente aqueles envolvidos na pesquisa translacional. Durante os últimos anos, a seção superior ‘Informações Gerais’ do FlyBase Gene Reports evoluiu para um ‘super-resumo’, compreendendo uma grande variedade de dados de visão geral dos genes (Figura 4). No FlyBase 2.0, isto inclui um instantâneo do gene, um resumo gerado automaticamente, a descrição do grupo genético ao qual o gene pertence (3), dados da função UniProt, informações históricas do Livro Vermelho (4), e um resumo do livro Interactive Fly (http://www.sdbonline.org/fly/aimain/1aahome.htm), sempre que estes estiverem disponíveis. Gene Snapshots são resumos escritos à mão que são solicitados a pesquisadores com experiência naquele gene, e fornecem uma rápida visão geral do que é conhecido sobre a função daquele gene (1).

Um outro resumo útil no FlyBase 2.0 Gene Reports é a ‘fita de resumo GO’ (Figura 5). Estas fitas foram previamente implementadas no Mouse Genome Database (MGD) (5), e mostram graficamente uma destilação de alto nível dos termos da Ontologia do Gene (GO) (6). Esta fita utiliza a estrutura hierárquica da Ontologia para condensar a cura de GO até algumas dezenas de termos de alto nível, que são então exibidos com chips de intensidade de cor indicando o número de anotações. Termos mais específicos são exibidos como um popup por rato – sobre uma célula individual, ou podem ser vistos em forma de tabela na seção Gene Ontology do relatório. A fita GO aumenta significativamente a capacidade do pesquisador de avaliar rapidamente o que é conhecido sobre a função de um gene.

Figure 5.

GO Summary Ribbon. GO summary ribbon for D. melanogaster gene Cdk1, as embedded in a FlyBase Gene Report.

Figure 5.

GO Summary Ribbon. GO summary ribbon for D. melanogaster gene Cdk1, como embutido em um relatório de genes da FlyBase.

FlyBase 2.0 Gene Reports agora incluem gráficos de domínio de proteínas de duas fontes de dados InterPro, Pfam e SMART, onde disponível (7,8). Os relatórios Polypeptide Reports exibem informações de domínio para a isoforma específica, enquanto os relatórios Gene exibem a isoforma mais longa. Os popups e tabelas Mouseover mostram dados mais detalhados do domínio e fornecem links para relatórios InterPro. Estas exibições complementam as faixas nos navegadores do genoma mostrando estes mesmos dados alinhados aos modelos de genes (veja abaixo).

Ferramentas EXPERIMENTAIS

Uma função indispensável do FlyBase é como uma fonte de informação sobre estirpes de moscas e reagentes para projetar experimentos. A importância desta função foi destacada por uma pesquisa do FlyBase de 2012 onde o ∼90% dos entrevistados disseram que ou acham o FlyBase ‘muito útil’ ou ‘não poderiam fazê-lo sem o FlyBase’. Para este fim, criamos uma nova classe de dados ‘Ferramenta Experimental’. Os relatórios descrevem ferramentas usadas para detecção de produtos genéticos (por exemplo, a etiqueta FLAG, EGFP), mira subcelular (por exemplo, sinal de localização nuclear, seqüência de sinal), expressão em um sistema binário (por exemplo, UAS, GAL4), ou expressão clonal/condicional (por exemplo, FLP, FRT). Cada relatório de Ferramenta Experimental fornece uma descrição da ferramenta e seus usos, juntamente com tabelas navegáveis de construções transgênicas relacionadas. Essas tabelas listam os componentes da construção (por exemplo, região regulatória, produto codificado), alelos transgênicos e construções, todos ligados a estoques para que os pesquisadores possam identificar facilmente as linhagens de moscas úteis. Para encontrar mais facilmente essas ferramentas, elas também são exibidas nos relatórios de alelos e construções relevantes, e a nova classe de dados da ferramenta experimental foi adicionada às listas de acertos interativas. Esta nova classe de dados de ferramentas experimentais melhora ainda mais o FlyBase como um importante recurso para a pesquisa Drosophila.

MULTI-SPECIES MINING AND TRANSLATIONAL RESEARCH

Durante alguns anos, o FlyBase hospedou dados e desenvolveu ferramentas para identificar ortologs de genes de moscas em múltiplos organismos. Isto incluiu dados ortológicos de OrthoDB (https://www.orthodb.org/, PMID:27899580) (9) e meta-análise de DIOPT (https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl) (10). As chamadas ortológicas da OrthoDB na FlyBase foram atualizadas em 2017, e agora incluem muitas espécies de Drosophila, outros insetos, e muitas outras espécies. Além de links para o gene ortológico, os Relatórios Genéticos agora incluem links para grupos OrthoDB, o que permite ao usuário identificar ortologs em até 5000 espécies.

DIOPT é uma meta-análise de muitos algoritmos diferentes de previsão ortográfica (incluindo OrthoDB), recentemente actualizada em 2018 para incluir a Arabidopsis thaliana e três novos algoritmos de previsão. Em FlyBase Gene Reports, as chamadas ortográficas DIOPT e OrthoDB entre Drosophila melanogaster e um conjunto central de outras espécies de organismos modelo são agregadas em um display compacto para produzir um resumo informativo. Esta seção também exibe links para o alinhamento de proteínas com o ortolog previsto, e indica se o ortolog humano, quando transferido para Drosophila, complementa funcionalmente o mutante mosca.

FlyBase 2.0 colaborou com os grupos de Norbert Perrimon e Hugo Bellen para desenvolver novas ferramentas online que permitem a busca da função do gene ortológico (Gene2Function;http://gene2function.org) (11), conservação dos sítios de fosforilação e outras modificações proteicas pós-tradução (https://www.flyrnai.org/tools/iproteindb/web/) (bioRxiv https://doi.org/10.1101/310854), interações genéticas entre organismos (MIST;http://fgrtools.hms.harvard.edu/mist) (12), e uma ferramenta de busca que retorna diversas informações sobre ortologs, genética humana e doenças (MARRVEL;http://marrvel.org) (13). Estes e outros links úteis para recursos externos são apresentados como ícones na barra lateral da página inicial do FlyBase. Estes são apenas alguns exemplos de como o FlyBase continua a colaborar com terceiros para desenvolver novas ferramentas e apoiar as descobertas fundamentais da comunidade Drosophila e pesquisas translacionais.

Nos últimos anos, o Consórcio FlyBase tem aumentado sua participação na Aliança de Recursos Genômicos (The Alliance;https://alliancegenome.org) (14). A ‘Aliança’ é uma colaboração para consolidar e homogeneizar a apresentação de dados entre diferentes organismos modelo, e integrá-la com a dos seres humanos, para acelerar a descoberta biológica e a pesquisa translacional. A Aliança representa actualmente a colaboração de seis bases de dados de organismos modelo (Saccharomyces Genome Database, WormBase, FlyBase, Zebrafish Information Network, Mouse Genome Database, Rat Genome Database) e o projecto Gene Ontology (GO). As atividades da Aliança são parte do Programa Big Data to Knowledge do NIH Common Fund (https://commonfund.nih.gov/bd2k), um importante objetivo do qual é o desenvolvimento de um ‘Data Commons’ (https://commonfund.nih.gov/commons). Este Data Commons será o repositório de grandes dados gerados pela pesquisa financiada pelo NIH, com APIs apropriadas que garantem que ele seja acessível a todos em um formato que possa ser encontrado, acessível, interoperável e reutilizável (FAIR). Nos últimos dois anos, o FlyBase tem fornecido grandes conjuntos de dados para o Data Commons e desenvolveu APIs para facilitar o seu uso. A Fase Piloto do Data Commons faz parte do Plano Estratégico do NIH para Data Sciencehttps://www.nih.gov/news-events/news-releases/nih-releases-strategic-plan-data-science para desenvolver novos métodos de armazenamento, compartilhamento e análise de conjuntos de dados derivados do NIH no ambiente de nuvem. Para mais informações sobre esses programas, a Aliança e o papel do FlyBase neles, remetemos o leitor a uma recente revisão abrangente (14).

REFERÊNCIAS INTERATIVAS E ABSTRACTIVAS GRÁFICAS

Nunca todas as páginas de relatórios do FlyBase têm uma seção de ‘Referências’ que contém uma lista de publicações associadas à entidade em questão (gene, alelo, inserção, etc.). Esta seção foi melhorada no FlyBase 2.0 com uma barra lateral interativa que permite ao usuário filtrar por tipo de publicação, por exemplo, ‘research paper’ ou ‘review’ (Figura 6). Os usuários também podem ordenar por ano ou autor, pesquisar por texto e exportar listas de publicações editadas para Batch Download, como uma HitList, ou como citações RIS para seu gerenciador de referência favorito. Para o Gene Report, um dos desafios crescentes é distinguir entre artigos que focam um gene daqueles que têm apenas uma referência menor a ele, por exemplo, como um ponto de dados em uma análise de todo o genoma. Para ajudar o usuário a identificar os trabalhos mais relevantes para esse gene, introduzimos uma seção de ‘publicação representativa’. Esta categoria contém até 25 artigos que a FlyBase identificou como os mais informativos no que diz respeito à identificação e função de um gene em particular. Para identificar essas publicações representativas, desenvolvemos um algoritmo que classifica os artigos por relevância, com base na quantidade e natureza dos dados curados para o gene em questão, especialmente priorizando artigos que mencionam o gene no título ou resumo. A capacidade de identificar os trabalhos mais informativos entre as centenas que mencionam um gene, juntamente com as outras capacidades de classificação da seção de referência, começa a abordar o problema da luta com a literatura biológica de rápido crescimento.

Figure 6.

Seção de Referências Interativas. Seção de Referências com opções de filtragem por tipos de publicação (barra lateral esquerda) incluindo publicações representativas, e várias opções de ordenação, pesquisa e exportação.

>Figure 6.

Secção de Referências Interativas. Seção de Referências com opções de filtragem por tipos de publicação (barra lateral esquerda) incluindo publicações representativas, e várias opções de ordenação, pesquisa e exportação.

Outra forma que o FlyBase está tentando ajudar os usuários a encontrar a literatura relevante é a inclusão de ‘resumos gráficos’ – imagens que resumem os achados de um artigo, introduzido pela Cell Press há alguns anos. O FlyBase entrou em acordo com a Cell Press para exibir os resumos gráficos no relatório de referência correspondente. As miniaturas destes resumos gráficos também são incluídas em painéis para itens de referência da lista de acertos, quando disponíveis. Clicando no resumo gráfico, o usuário é direcionado para o resumo e para o artigo no Cell Press.

NOVAS TRACKSER GENOME E MIGRAÇÕES DO GENOMA GBrowse To JBrowse

Durante alguns anos, o navegador do genoma GBrowse no FlyBase exibiu modelos de genes anotados e muitas outras características mapeadas do genoma e epigenoma, todas mostradas como ‘trilhas’ separadas (15) Trilhas exclusivas do FlyBase incluem gráficos de sinal do RNA-Seq de diferentes projetos ao longo do tempo de desenvolvimento ou em resposta a estímulos ambientais e domínios proteicos alinhados ao D. melanogaster (1). A informação do domínio proteico foi melhorada com uma nova faixa que mostra os domínios previstos pelo SMART, complementando a faixa ‘Pfam’ anteriormente implementada, e fornecendo uma segunda visão independente de quais domínios proteicos são codificados por um gene e como eles são distribuídos entre os exons (7,8). Gene e Polypeptide Reports também contêm esquemas desses domínios (veja Melhorias no Report, acima).

Embora o GBrowse tenha sido a plataforma do navegador de genoma FlyBase por muitos anos, com o FlyBase 2.0 começamos a migrar os rastros do genoma para um navegador de genoma de próxima geração chamado JBrowse (16). JBrowse tem uma série de características únicas que melhoram a facilidade de navegação e funcionalidade do genoma, tais como maior velocidade e capacidade de resposta, faixas configuráveis, seleção de faixas na mesma tela, e navegação por clique e arraste. A maioria das páginas com links do navegador do genoma no FlyBase 2.0 atualmente permite aos usuários selecionar entre GBrowse e JBrowse. Uma vez que nossa migração para o JBrowse esteja completa, o GBrowse será depreciado, mas ainda acessível por um ano, após o qual o JBrowse será o único navegador de genoma hospedado pelo FlyBase. Além dos navegadores de genoma no FlyBase, recentemente adicionamos links dentro da seção ‘outras visualizações de genoma’ do Relatório de Gene para navegadores no NCBI, Ensembl, UCSC e PopFly, que possuem anotações e funcionalidades diferentes (Figura 4). Por exemplo, o navegador PopFly retrata polimorfismos de DNA identificados em populações naturais de D. melanogaster. O FlyBase avalia continuamente novos conjuntos de dados da comunidade para inclusão em nossos navegadores de genoma. Os planos atuais incluem melhorias na anotação do proteoma de desenvolvimento e a adição de localizações de locais alvo eficientes de gRNA para engenharia CRISPR que foram previstos pelo Drsosophila RNAi Screening Center (DRSC) (https://fgr.hms.harvard.edu/) (17).

NEW TOOLS FOR POWER USERS

A construção do FlyBase 2.0 implicou uma mudança significativa na arquitetura backend que permitiu novas capacidades para ‘power users’. Melhoramos a compatibilidade com a nuvem, adicionamos uma interface de programação de aplicativos (API) (https://flybase.github.io/) e reorganizamos fundamentalmente o código para ter uma estrutura mais modular. Continuamos a suportar um banco de dados Chado publicamente acessível (https://flybase.github.io/) e downloads de XML, FASTA, GFF, GTF e outros arquivos de dados em massa através do nosso site FTP (ftp://ftp.flybase.org/).

CONEXÕES PARA A COMUNIDADE

FlyBase se beneficia muito de uma comunidade de usuários bem engajados. Desde 2014, o FlyBase Community Advisory Group (FCAG), um grupo de mais de 500 pesquisadores no mundo inteiro com o compromisso de melhorar o FlyBase, tem respondido a pesquisas regulares com informações inestimáveis sobre como os pesquisadores realmente usam o FlyBase, e sugestões para novas capacidades. Esse feedback continua a moldar como o FlyBase se adapta aos novos dados e necessidades dos usuários. Nosso objetivo é ter um representante no FCAG de cada laboratório Drosophila; novos representantes podem se registrar seguindo o link do Grupo Consultivo da Comunidade FlyBase no menu Comunidade do FlyBase (http://flybase.org/wiki/FlyBase:Community_Advisory_Group). Outro esforço contínuo é a produção de vídeos tutoriais, que tem acelerado nos últimos dois anos com oito novos vídeos postados em nosso canal no YouTube (https://www.youtube.com/c/FlyBaseTV), cobrindo várias técnicas de busca, novas funcionalidades do site FlyBase 2.0, e JBrowse. O novo site também exibe o feed do FlyBase Twitter (https://twitter.com/FlyBaseDotOrg) na barra lateral esquerda da página inicial, que usamos para alertar os usuários sobre novos dados e recursos e notícias atuais relevantes para a comunidade fly.

LOOKING TO THE FUTURE

Um desafio futuro será acompanhar o crescimento acelerado da informação biológica, incluindo a sempre crescente quantidade de grandes dados de novos métodos de alta produtividade. Entre esses novos métodos estão o sequenciamento de RNA unicelular (RNA-Seq), que produz volumes de informação temporal e espacial de granulação fina sobre a expressão gênica. Para realizar todo o potencial desse método, será imperativo desenvolver novas abordagens para integrar e exibir a grande quantidade de dados em um formato interativo que seja ao mesmo tempo útil e fácil. O FlyBase continuará a integrar os dados do proteoma de desenvolvimento à medida que estes se tornam disponíveis, e integrá-los com os dados do RNA-Seq através de exibições gráficas e JBrowse para produzir uma ferramenta poderosa para a genômica funcional. O desenvolvimento futuro de novos displays interativos para caminhos e interações entre esses produtos genéticos irá fortalecer ainda mais uma abordagem sistêmica para a compreensão das redes celulares. Nós também prevemos a integração de outras classes de dados fundamentalmente novas. Entre elas estão as vias metabólicas de Drosophila e o microbioma, a população de microorganismos dentro e na mosca. Dado que a construção do FlyBase e outros MODs tem sido centrada no gênero, a integração desses dados apresentará novos desafios, e exigirá colaborações de terceiros e link-outs. Naturalmente, a resposta a todos estes desafios de informação biológica crescente dependerá da disponibilidade de recursos suficientes.

FlyBase também continuará como membro activo da Aliança de Recursos Genéticos (The Alliance; https://alliancegenome.org) (14). Isto incluirá esforços para homogeneizar os dados e desenvolver novas exibições e ferramentas para pesquisa fundacional e translacional. Parte desses esforços será a criação de novas APIs que permitam aos usuários poderosos recuperar e trabalhar com grandes conjuntos de dados depositados no NIH Data Commons. Estes serão importantes esforços futuros, pois a torrente de grandes dados e a importância da bioinformática para a pesquisa biomédica continua a aumentar.

Nos últimos 27 anos o FlyBase evoluiu de um simples banco de dados para uma poderosa base de conhecimento. Além de seu papel essencial de curar e disseminar dados de moscas, o FlyBase continua a desenvolver novas ferramentas para a descoberta da função genética através dos organismos e suas ligações com doenças humanas (18). O FlyBase continua essencial para apoiar os numerosos tipos de dados específicos da comunidade de pesquisa sobre moscas, para que o potencial completo de Drosophila para a descoberta biológica e pesquisa translacional possa ser realizado (19). Continuando a construir sobre a base de conhecimento do FlyBase 2.0, a comunidade Drosophila terá mais poder para explorar novas idéias, para buscar novos aspectos da vida e para ir ousadamente onde ninguém foi antes.

ACKNOWLEDGEMENTS

Gostaríamos de agradecer aos outros PIs, curadores e desenvolvedores do FlyBase por seus comentários sobre o manuscrito. Um agradecimento especial a Julie Agapite e Victoria Jenkins por suas extensas contribuições editoriais. No momento de escrever, os membros do FlyBase Consortium incluíram: Norbert Perrimon, Susan Russo Gelbart, Julie Agapite, Kris Broll, Lynn Crosby, Gilberto dos Santos, David Emmert, L. Sian Gramates, Kathleen Falls, Victoria Jenkins, Beverley Matthews, Carol Sutherland, Christopher Tabone, Pinglei Zhou, Mark Zytkovicz, Nick Brown, Giulia Antonazzo, Helen Attrill, Phani Garapati, Alex Holmes, Aoife Larkin, Steven Marygold, Gillian Millburn, Clare Pilgrim, Vitor Trovisco, Pepe Urbano, Thomas Kaufman, Brian Calvi, Bryon Czoch, Josh Goodman, Victor Strelets, Jim Thurmond, Richard Cripps, Phillip Baker.

FUNDANDO

FlyBase é financiada pelo NIH, NHGRI ; UK Medical Research Council . Financiamento para taxa de acesso aberto: NIH, NHGRI .

Conflito de declaração de interesses. Nenhum declarado.

Gramates
L.S.

,

Marygold
S.J.

,

Santos
G.D.

,

Urbano
J.M.

,

Antonazzo
G.

,

Matthews
B.B.

,

Rey
A.J.

,

Tabone
C.J.

,

Crosby
M.A.

,

Emmert
D.B.

et al.

FlyBase a 25: olhando para o futuro

.

Ácidos nucléicos Res.
2017

;

45

:

D663

D671

.

>

Cozinhar

>

K.R.

,

Parks

>

A.L.

,

Jacobus
L.M.

,

Kaufman
T.C.

,

Matthews
K.A.
Novos recursos de pesquisa no centro de estoques de drosophila bloomington

.

Fly

.

2010

;

4

:

88

91

.

>

Attrill

>

H.

,

Quedas

>

K.

,

Bom homem
J.L.

,

Millburn
G.H.

,

Antonazzo
G.

,

Rey
A.J.J.

,

S.J.
Marygold.
FlyBase Consortium
FlyBase: estabelecendo um recurso do Grupo Gene para Drosophila melanogaster

.

Ácidos nucléicos Res.
2016

;

44

:

D786

D792

.

Lindsley
D.L.

,

Zimm
G.G.
O Genoma de Drosophila Melanogaster

.

1992

;

San Diego

:

Prensa Académica

.

>

Smith

>

C.L.

,

Blake

>

J.A.

,

Kadin

>

J.A.

,

Richardson

>

J.E.

,

Bult
C.J.

>

Base de dados do genoma do rato, G.

>

Base de dados do genoma do rato (MGD)-2018: base de conhecimento para o rato de laboratório

.

Ácidos Nucleicos Res.
2018

;

46

:

D836

D842

.

>

O Consórcio de Ontologia Genética

>

Expansão da base de conhecimento e recursos da ontologia genética

.

Ácidos nucléicos Res.
2017

;

45

:

D331

D338

.

Finn
R.D.

,

Coggill
P.

,

Eberhardt
R.Y.

,

Eddy
S.R.

,

Mistério
J.

,

Mitchell
A.L.

,

Potter
S.C.

,

Punta

>

M.

,

Qureshi

>

M.

,

Sangrador-Vegas
A.

et al.

O banco de dados das famílias proteicas Pfam: rumo a um futuro mais sustentável

.

Ácidos nucléicos Res.
2016

;

44

:

D279

D285

.

>

Letúnica

>

I.

,

Bork
P.
20 anos do recurso de anotação do domínio da proteína SMART

.

Ácidos nucléicos Res.
2018

;

46

:

D493

D496

.

>

Zdobnov
E.M.

,

Tegenfeldt
F.

,

Kuznetsov
D.

,

Waterhouse
R.M.

,

Simao
F.A.

,

Ioannidis
P.

,

Seppey
M.M.

,

Loetscher
A.

,

Kriventseva
E.V.
OrthoDB v9.1: catalogação de anotações evolutivas e funcionais para ortologs animais, fúngicos, vegetais, arqueológicos, bacterianos e virais

.

Ácidos nucléicos Res.
2017

;

45

:

D744

D749

.

>

Hu

>

Y.

,

Flockhart
I.

,

Vinayagam
A.

,

Bergwitz
C.

,

Berger
B.

,

Perrimon
N.

,

Mohr
S.E.
Uma abordagem integrativa da previsão ortológica para estudos centrados na doença e outros estudos funcionais

.

BMC Bioinformática

.

2011

;

12

:

357

.

>

Hu

>

Y.

,

Comjean
A.

,

Mohr
S.E.

,

FlyBase
C.

,

Perrimon
N.
Gene2Function: Um recurso online integrado para a descoberta da função genética

.

2017

;

7

:

2855

2858

.

.

>

Hu
Y.

,

Vinayagam
A.

,

Nand
A.

,

Comjean
A.

,

Chung
V.

,

Hao
T.

,

Mohr
S.E.

,

Perrimon
N.
Molecular Interaction Search Tool (MIST): um recurso integrado para dados de interação de genes e proteínas de mineração

.

Ácidos nucléicos Res.
2018

;

46

:

D567

D574

.

>

Wang
J.

,

Al-Ouran
R.

,

Hu
Y.

,

Kim
S.Y.

,

Wan
Y.W.

,

Wangler

,

M.F.

,

Yamamoto

,

S.

,

Chao
H.T.

,

Comjean
A.

,

Mohr
S.E.

et al.

MARRVEL: Integração dos recursos genéticos humanos e do organismo modelo para facilitar a anotação funcional do genoma humano

.

Am. J. Hum. Genet.
2017

;

100

:

843

853

.

>

>Como

>

D.G.

,

Blake

>

J.A.

,

Bradford
Y.M.

,

Bult
C.J.

,

Calvi
B.R.

,

Engel
S.R.

,

Kadin
J.A.

,

Kaufman

>

T.C.

,

Kishore

>

R.

,

Laulederkind
S.J.F.

et al.

Modelo de dados do organismo evoluindo em apoio à medicina translacional

.

Lab. Animais. (NY)

.

2018

;

47

:

277

289

.

>

Stein

>

L.D.

>

Utilizar GBrowse 2.0 para visualizar e compartilhar dados da seqüência da próxima geração

.

Brief. Bioinform.
2013

;

14

:

162

171

.

>

Buels
R.

,

Yao
E.

,

Diesh
C.M.

,

Hayes
R.D.

,

Munoz-Torres
M.

,

Helt
G.

,

Goodstein
D.M.

,

Elsik
C.G.

,

Lewis
S.E.

,

Stein
L.

et al.

JBrowse: a dynamic web platform for genome visualization and analysis

.

Genoma Biol.
2016

;

17

:

66

.

>

Mohr

>

S.E.

,

Hu

>

Y.

,

Ewen-Campen

>

B.

,

Housden
B.E.

,

Viswanatha

,

R.

,

Perrimon
N.
CRISPR guia RNA design para aplicações de pesquisa

.

FEBS J.
2016

;

283

:

3232

3238

.

>

Wangler

>

M.F.

,

Yamamoto

>

S.

,

Bellen
H.J.J.

>

Fruit flies in biomedical research

.

Genetics

.

2015

;

199

:

639

653

.

>

Bilder

>

D.

,

Irvine

>

K.D.

>

Cepa do ecossistema de pesquisa Drosophila

.

Genetics

.

2017

;

206

:

1227

1236

.

Notas do autor

Os membros do Consórcio FlyBase estão listados nos Agradecimentos.

© O(s) autor(es) 2018. Publicado pela Oxford University Press em nome da Nucleic Acids Research.
> Este é um artigo de Acesso Livre distribuído sob os termos da Licença de Atribuição Creative Commons (http://creativecommons.org/licenses/by/4.0/), que permite a reutilização, distribuição e reprodução sem restrições em qualquer meio, desde que a obra original seja devidamente citada.

Deixe uma resposta

O seu endereço de email não será publicado.