FlyBase 2.0: de volgende generatie

Abstract

FlyBase (flybase.org) is een kennisbank die ondersteuning biedt aan de gemeenschap van onderzoekers die de fruitvlieg, Drosophila melanogaster, gebruiken als modelorganisme. Het FlyBase team cureert en organiseert een gevarieerd aanbod van genetische, moleculaire, genomische en ontwikkelingsinformatie over Drosophila. Begin 2018 werd ‘FlyBase 2.0’ uitgebracht met een aanzienlijk verbeterde gebruikersinterface en nieuwe tools. Tot deze belangrijke veranderingen behoren een nieuwe organisatie van zoekresultaten in interactieve lijsten of tabellen (hitlists), verbeterde referentielijsten en nieuwe grafieken van eiwitdomeinen. Een belangrijke nieuwe gegevens klasse genaamd ‘experimentele tools’ consolideert informatie over nuttige vliegen stammen en andere middelen met betrekking tot een specifiek gen, die aanzienlijk verbetert de mogelijkheid van de Drosophila onderzoeker om te ontwerpen en uit te voeren experimenten. Met de release van FlyBase 2.0, is er ook een herstructurering geweest van de backend architectuur en een verdere ontwikkeling van application programming interfaces (API’s) voor programmatische toegang tot FlyBase gegevens. In dit overzicht beschrijven we deze belangrijke nieuwe kenmerken en functionaliteiten van de FlyBase 2.0 site en hoe ze het gebruik van Drosophila als een modelorganisme voor biologische ontdekking en translationeel onderzoek ondersteunen.

INLEIDING

FlyBase (flybase.org) is de belangrijkste bewaarplaats en webportaal voor genetische gegevens met betrekking tot Drosophila melanogaster, de fruitvlieg. Het FlyBase Consortium is een team van curatoren, ontwikkelaars en onderwijzers op vier locaties: Harvard University, University of Cambridge, Indiana University, en University of New Mexico. FlyBase bevat gegevens die zijn samengesteld uit primaire wetenschappelijke literatuur over meer dan een eeuw genetisch onderzoek. In de loop der jaren heeft het consortium nieuwe formaten ontwikkeld voor de weergave van de gegevens en nieuwe bio-informaticatools om deze gegevens te gebruiken voor biologische ontdekkingen en translationeel onderzoek. Deze inspanningen hebben FlyBase getransformeerd van een eenvoudige database in een krachtige kennisbank.

De FlyBase-site heeft grote veranderingen ondergaan sinds onze laatste beoordeling twee jaar geleden (1). In februari 2017 hebben we een bètaversie van de volgende generatie website uitgebracht, die we “FlyBase 2.0” hebben genoemd. Na een periode van openbare feedback en bijschaven, verving FlyBase 2.0 de vorige website in december 2017. In deze review bespreken we wat er anders en beter is aan deze next-generation website, en wat u kunt verwachten van een bezoek aan de nieuwe en verbeterde FlyBase 2.0, nu en in de toekomst. Hoewel we ons in dit overzicht concentreren op de nieuwe gegevens en hulpmiddelen, zijn er ook enkele belangrijke wijzigingen in de FlyBase 2.0 gebruikersinterface (UI). We verwijzen de geïnteresseerde lezer naar de vorige NAR-review in 2017 voor een uitgebreide bespreking van andere aspecten van FlyBase (1).

QuickSearch EN HITLISTS

Gebruiksstatistieken geven aan dat de meeste gebruikers FlyBase bevragen via ‘QuickSearch’ op de startpagina. In augustus van 2017 heeft FlyBase het tabblad ‘GAL4 etc’ toegevoegd aan ‘QuickSearch.’ Deze zoekopdracht kwam tegemoet aan een reeds lang bestaande behoefte aan een hanteerbare manier om FlyBase te doorzoeken op GAL4 en andere binaire drivers, evenals lacZ en GFP reporters, met behulp van verschillende soorten expressiepatronen. Het zoeken geeft allelen, constructen, invoegingen, en beschikbare voorraden, en heeft een optie om de resultaten weer te geven in geassocieerde groepen (figuur 1). Het markeert ook enkele van de meest populaire GAL4 drivers op basis van voorraad bestelinformatie van de BDSC, en het aantal keren dat ze worden genoemd in publicaties (2). Het tabblad “GAL4 etc” bevat ook een link naar een uitgebreide lijst van deze “veelgebruikte” GAL4-drivers.

Figuur 1.

GAL4-zoekresultaat. Een resultatentabel voor een zoekactie via het tabblad “GAL4 etc” QuickSearch, met de uitvoeroptie “geïntegreerde tabel” geselecteerd. Kruisverwijzingen worden gebruikt om geassocieerde allelen, constructen, invoegingen en stammen te groeperen. Twee ‘veelgebruikte’ GAL4-stuurprogramma’s zijn gemarkeerd.

Figuur 1.

GAL4-zoekresultaat. Een resultatentabel voor een zoekactie via het tabblad ‘GAL4 etc’ Snelzoeken, met de uitvoeroptie ‘geïntegreerde tabel’ geselecteerd. Kruisverwijzingen worden gebruikt om geassocieerde allelen, constructen, invoegingen en stammen te groeperen. Twee ‘veelgebruikte’ GAL4-stuurprogramma’s zijn gemarkeerd.

Hoewel QuickSearch meerdere tabbladen heeft voor specifieke zoekopdrachten, gebruiken de meeste mensen het algemene tabblad ‘Search FlyBase’. Gezien het belang van dit toegangspunt, hebben we een groot deel van onze inspanningen gewijd aan het fundamenteel veranderen en verbeteren van de ‘hitlijsten’ die door deze zoekopdracht worden teruggegeven voor FlyBase 2.0, waarbij we volledig gebruik hebben gemaakt van de nieuwe site-architectuur (figuur 2). De UI-verbeteringen aan de resultatenpagina van de trefferlijst omvatten een ‘responsive’ lay-out voor weergave op kleine schermen (bijv. smartphones), paginering om de laadtijd te verkorten, en een ingebed nieuw zoekformulier.

Figuur 2.

Resultaten trefferlijst zoeken. De resultatenpagina voor Zoeken in FlyBase met ‘Mad’ als zoekterm. Er wordt een ‘hitlijst’ weergegeven met genen, stammen, allelen en vele andere klassen van FlyBase-gegevensitems (sommige niet getoond). De Mad gen rapport knop is gemarkeerd met een blauwe vlag, wat wijst op nieuwe annotaties in de huidige versie; met de muis over de vlag gaan toont een samenvatting. De lijst wordt omlijst door een reeks hulpmiddelen voor het filteren op gegevensklasse en soort, paginering, weergave en analyse.

Figuur 2.

Hitlijst met zoekresultaten. De resultatenpagina voor Zoeken in FlyBase met “Mad” als zoekterm. Er wordt een ‘hitlijst’ weergegeven met genen, stammen, allelen en vele andere klassen van FlyBase-gegevensitems (sommige niet getoond). De Mad gen rapport knop is gemarkeerd met een blauwe vlag, wat wijst op nieuwe annotaties in de huidige versie; met de muis over de vlag gaan toont een samenvatting. De lijst is omlijst met een reeks hulpmiddelen voor het filteren op gegevensklasse en soort, paginering, weergave en analyse.

Een belangrijk kenmerk van de nieuwe trefferlijst is dat deze ‘gemengd’ is, dat wil zeggen dat alle klassen van FlyBase-gegevens die overeenkomen met de zoekterm erin zijn opgenomen. Elk overeenkomend item staat in een paneel, dat een beknopte selectie van belangrijke informatie bevat (figuur 2). Kleurgecodeerde badges langs de rechtermarge maken het mogelijk snel items per gegevensklasse te scannen (figuur 2). Een blauwe vlag geeft aan dat er nieuwe gegevens aan een item zijn toegevoegd in de meest recente FlyBase versie (figuur 2). Knoppen linken naar FlyBase rapporten, genoom-browsers, of nieuwe hitlists van gerelateerde items, bv. een paneel voor een bepaald gen zal knoppen bevatten voor geassocieerde allelen, stammen, transcripten, polypeptiden en referenties (figuur 2). Elk dataklasse-paneel bevat ook klasse-specifieke informatie; een allel-paneel toont bijvoorbeeld het mutageen dat is gebruikt om het allel te genereren, eventuele bijbehorende inserties, en het aantal fenotype-verklaringen dat aan het allel is gekoppeld.

De gemengde trefferlijst kan worden gefilterd op soort of op dataklasse (Figuur 2). De soort filter kunt u kiezen of op te nemen / uit te sluiten menselijke transgenen in vliegen, evenals niet-melanogaster of niet-Drosophila resultaten. De gegevens klasse filters kunnen worden ingesteld om een meer smalle hitlijst bestaande uit een paar gegevens klassen van belang, of een enkele gegevens klasse weer te geven. Door de zoekresultaten te beperken tot een enkele dataklasse worden de hulpmiddelen en weergaveopties voor een enkele klasse vrijgegeven. Merk op dat de meeste tabbladen in de QuickSearch tool direct trefferlijsten voor een enkele dataklasse genereren.

Wanneer de trefferlijst wordt gefilterd tot een enkele dataklasse, wordt een ‘Tabel’ weergave-optie beschikbaar. De tabelweergave is een verticaal compacte tabulaire weergave, met sorteerbare kolommen die bij die klasse passen (figuur 3). Een reeks analyse-instrumenten wordt beschikbaar wanneer een hitlijst een enkele gegevensklasse omvat. Deze tools verschijnen bovenaan de hitlijstpagina als een rij knoppen met de labels ‘Converteren’, ‘Exporteren’ en ‘Analyseren’ (Figuur 3). De Convert-knop wordt gevoed door de uitgebreide kruisverwijzingen tussen dataklassen, waardoor u bijvoorbeeld een lijst met genen kunt omzetten in een lijst met gerelateerde referenties, of een lijst met allelen in een lijst met geassocieerde invoegingen. De Export knop brengt de huidige hitlijst naar één van de vele FlyBase tools, zoals Batch Download of Feature Mapper. Dit is ook de beste manier om een hitlijst te downloaden als een set FlyBase ID’s. De Analyze knop kan verschillende types van korte rapporten genereren die de hitlijst samenvatten, zoals frequenties van anatomie termen of fenotypische klassen voor een allel hitlijst, of kan de hitlijst doorsturen naar de Interactions Browser tool. Met deze verbeteringen is de trefferlijst een krachtig hulpmiddel geworden voor het bekijken, verfijnen en analyseren van FlyBase-zoekresultaten.

Figuur 3.

Tabelweergave van de trefferlijst met zoekresultaten. De pagina met zoekresultaten ‘Gek’, gefilterd op de gegevensklasse Allel en omgeschakeld naar tabelweergave. Het menu Export-tool is uitgebreid.

Figuur 3.

Tabelweergave van de hitlijst met zoekresultaten. De pagina met zoekresultaten ‘Gek’, gefilterd op de gegevensklasse Allel en omgeschakeld naar tabelweergave. Het menu Export-tool is uitgebreid.

VERBETERINGEN VAN RAPPORTEN

Er zijn diverse belangrijke wijzigingen aangebracht in de FlyBase-rapporten die de bruikbaarheid verbeteren en de weergave van gegevens verbeteren. Zo bevatten alle rapporten nu een navigatiepaneel aan de rechterzijde van de pagina (Figuur 4). Dit paneel bevat links naar alle secties op het hoogste niveau in het rapport en kan worden gebruikt om snel naar de gewenste secties te springen. De sectie “Referenties” van alle rapporten is verbeterd om het filteren en sorteren door lijsten van publicaties te vergemakkelijken (zie de sectie “Interactieve referenties en grafische samenvattingen” hieronder voor meer informatie).

Figuur 4.

FlyBase Genenrapport. FlyBase Genenrapport voor het Cdk1-gen. De sectie Algemene informatie dient als een ‘super-samenvatting’ van de geninformatie. Het menu ‘Rapportsecties’ rechts zweeft terwijl de gebruiker door het rapport scrollt, wat een gemakkelijk navigatiehulpmiddel is. De sectie Genomische locatie bevat externe links naar genoombrowsers bij NCBI, Ensembl, UCSC en PopFly.

Figuur 4.

FlyBase Genenrapport. FlyBase Genenrapport voor het Cdk1-gen. De sectie Algemene informatie dient als een ‘super-samenvatting’ van de geninformatie. Het menu ‘Rapportsecties’ rechts zweeft terwijl de gebruiker door het rapport scrollt, wat een gemakkelijk navigatiehulpmiddel is. De sectie Genomic Location bevat externe links naar genoombrowsers bij NCBI, Ensembl, UCSC en PopFly.

Samenvattende functionele informatie voor genen is belangrijk voor onze site-gebruikers, vooral voor degenen die betrokken zijn bij translationeel onderzoek. Gedurende de laatste jaren is het bovenste deel van FlyBase Genenrapporten, ‘Algemene informatie’, geëvolueerd tot een ‘super-samenvatting’, die een grote verscheidenheid aan genenoverzichtsgegevens bevat (Figuur 4). In FlyBase 2.0 omvat dit een Gene Snapshot, een automatisch gegenereerde samenvatting, de beschrijving van de Gengroep waartoe het gen behoort (3), UniProt functiegegevens, historische Red Book informatie (4), en een samenvatting van Interactive Fly (http://www.sdbonline.org/fly/aimain/1aahome.htm), wanneer deze beschikbaar zijn. Gene Snapshots zijn handgeschreven samenvattingen die worden gevraagd aan onderzoekers met expertise in dat gen, en geven een snel overzicht van wat er bekend is over de functie van dat gen (1).

Een andere nuttige samenvatting in FlyBase 2.0 Gene Reports is het ‘GO summary ribbon’ (figuur 5). Deze linten werden eerder geïmplementeerd in Mouse Genome Database (MGD) (5), en tonen grafisch een distillatie op topniveau van Gene Ontology (GO) termen (6). Dit lint maakt gebruik van de hiërarchische structuur van de Ontology te condenseren GO curatie tot een paar dozijn high-level termen, die vervolgens worden weergegeven met kleur intensiteit chips met vermelding van het aantal annotaties. Meer specifieke termen worden weergegeven als een popup door met de muis over een individuele cel te gaan, of kunnen in tabelvorm worden bekeken in de Gene Ontology-sectie van het rapport. Het GO-lint vergroot de mogelijkheden van de onderzoeker aanzienlijk om snel te beoordelen wat er bekend is over de functie van een gen.

Figuur 5.

GO-overzichtslint. GO-samenvattingslint voor D. melanogaster-gen Cdk1, zoals opgenomen in een FlyBase-genrapport.

Figuur 5.

GO-samenvattingslint. GO-samenvattingslint voor D. melanogaster-gen Cdk1, zoals opgenomen in een FlyBase-genenrapport.

FlyBase 2.0-genenrapporten bevatten nu afbeeldingen van eiwitdomeinen uit twee InterPro-gegevensbronnen, Pfam en SMART, indien beschikbaar (7,8). De Polypeptide Rapporten tonen domein informatie voor de specifieke isovorm terwijl de Genen rapporten de langste isovorm tonen. Mouseover popups en tabellen tonen meer gedetailleerde domeingegevens, en geven links naar InterPro rapporten. Deze displays vormen een aanvulling op de tracks in de genoom-browsers die dezelfde gegevens uitgelijnd met gen-modellen tonen (zie hieronder).

EXPERIMENTELE TOOLS

Een onmisbare functie van FlyBase is als een bron van informatie over vliegenstammen en reagentia om experimenten te ontwerpen. Het belang van deze functie werd benadrukt door een 2012 FlyBase enquête waar ∼90% van de respondenten zei dat ze ofwel FlyBase ‘zeer behulpzaam’ of ze ‘zou het niet kunnen doen zonder FlyBase’. Daartoe hebben we een nieuwe gegevensklasse “Experimental Tool” gecreëerd. De rapporten beschrijven hulpmiddelen die worden gebruikt voor genproductdetectie (bv. de FLAG-tag, EGFP), subcellulaire targeting (bv. nucleaire lokalisatiesignaal, signaalsequentie), expressie in een binair systeem (bv. UAS, GAL4), of klonale/conditionele expressie (bv. FLP, FRT). Elk experimenteel hulpprogramma bevat een beschrijving van het hulpprogramma en het gebruik ervan, samen met bladerbare tabellen van verwante transgene constructies. Deze tabellen geven een lijst van de construct-componenten (bv. regulerende regio, gecodeerd product), transgene allelen, en constructen, allemaal gekoppeld aan voorraden, zodat onderzoekers gemakkelijk nuttige vliegenstammen kunnen identificeren. Om deze tools gemakkelijker te vinden, worden ze ook weergegeven op de relevante allel en construct rapporten, en de nieuwe experimentele tool dataklasse is toegevoegd aan de interactieve hitlists. Met deze nieuwe klasse experimentele hulpmiddelen wordt FlyBase verder uitgebouwd tot een belangrijke bron voor Drosophila-onderzoek.

MULTI-SPECIES MINING AND TRANSLATIONAL RESEARCH

Voor een aantal jaren heeft FlyBase gegevens gehost en hulpmiddelen ontwikkeld om orthologs van vliegengenen in meerdere organismen te identificeren. Dit heeft orthologie gegevens van OrthoDB (https://www.orthodb.org/, PMID:27899580) (9) en meta-analyse van DIOPT (https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl) (10). De OrthoDB orthologie-oproepen in FlyBase werden in 2017 bijgewerkt en omvatten nu vele Drosophila-soorten, andere insecten en vele andere soorten. Naast links naar het orthologe gen, bevatten Gene Reports nu links naar OrthoDB-groepen, waarmee de gebruiker orthologs kan identificeren in maximaal 5000 soorten.

DIOPT is een meta-analyse van veel verschillende orthologievoorspellingsalgoritmen (waaronder OrthoDB), onlangs bijgewerkt in 2018 om Arabidopsis thaliana en drie nieuwe voorspellingsalgoritmen op te nemen. In FlyBase Gene Reports worden DIOPT en OrthoDB orthologie-oproepen tussen Drosophila melanogaster en een kernset van andere modelorganisme-soorten samengevoegd in een compacte weergave om een informatieve samenvatting te produceren. Deze sectie toont ook links naar de eiwit uitlijning met de voorspelde ortholoog, en geeft aan of de menselijke ortholoog, wanneer overgebracht in Drosophila, functioneel de vlieg mutant aanvult.

FlyBase 2.0 heeft samengewerkt met de groepen van Norbert Perrimon en Hugo Bellen om nieuwe online-hulpmiddelen te ontwikkelen waarmee kan worden gezocht naar orthologe genfuncties (Gene2Function;http://gene2function.org) (11), behoud van fosforyleringsplaatsen en andere post-translationele modificaties van eiwitten (https://www.flyrnai.org/tools/iproteindb/web/) (bioRxiv https://doi.org/10.1101/310854), geninteracties tussen organismen (MIST;http://fgrtools.hms.harvard.edu/mist) (12), en een zoekinstrument dat diverse informatie over orthologe genen, menselijke genetica en ziekte (MARRVEL;http://marrvel.org) (13) retourneert. Deze en andere nuttige links naar externe bronnen zijn te zien als pictogrammen in de zijbalk van de FlyBase home page. Dit zijn slechts een paar voorbeelden van hoe FlyBase blijft samenwerken met derden om nieuwe instrumenten te ontwikkelen en de fundamentele ontdekkingen en translationeel onderzoek van de Drosophila gemeenschap te ondersteunen.

In de afgelopen jaren heeft het FlyBase Consortium zijn deelname aan The Alliance of Genome Resources (The Alliance;https://alliancegenome.org) (14) vergroot. De “Alliance” is een samenwerkingsverband om de presentatie van gegevens over verschillende modelorganismen te consolideren en te homogeniseren, en deze te integreren met die van de mens, om biologische ontdekking en translationeel onderzoek te versnellen. De Alliance vertegenwoordigt momenteel de samenwerking van zes databanken van modelorganismen (Saccharomyces Genome Database, WormBase, FlyBase, Zebrafish Information Network, Mouse Genome Database, Rat Genome Database) en het Gene Ontology (GO) project. De activiteiten van de Alliance maken deel uit van het “Big Data to Knowledge”-programma (https://commonfund.nih.gov/bd2k) van het Common Fund van het NIH, waarvan een belangrijk doel de ontwikkeling van een “Data Commons” (https://commonfund.nih.gov/commons) is. Deze “Data Commons” worden de bewaarplaats voor “big data” die door NIH-gefinancierd onderzoek worden gegenereerd, met passende API’s die ervoor zorgen dat de gegevens voor iedereen toegankelijk zijn in een formaat dat vindbaar, toegankelijk, interoperabel en herbruikbaar is (FAIR). De afgelopen twee jaar heeft FlyBase grote datasets ter beschikking gesteld van de Data Commons en API’s ontwikkeld om het gebruik ervan te vergemakkelijken. De proeffase van de Data Commons maakt deel uit van het strategisch plan van het NIH voor gegevenswetenschaphttps://www.nih.gov/news-events/news-releases/nih-releases-strategic-plan-data-science om nieuwe methoden te ontwikkelen voor het opslaan, delen en analyseren van van NIH-afgeleide datasets in de cloud-omgeving. Voor meer informatie over deze programma’s, de Alliantie, en de rol van FlyBase daarin, verwijzen wij de lezer naar een recent uitgebreid overzicht (14).

INTERACTIVITEITENVERWIJZINGEN EN GRAFISCHE ABSTRACTS

Bijna alle FlyBase rapportpagina’s hebben een sectie ‘Referenties’ die een lijst bevat van publicaties in verband met de gegeven entiteit (gen, allel, insertie, enz.). Deze sectie is in FlyBase 2.0 uitgebreid met een interactieve zijbalk die de gebruiker in staat stelt te filteren op publicatietype, b.v. ‘research paper’ of ‘review’ (figuur 6). Gebruikers kunnen ook sorteren op jaar of auteur, zoeken op tekst, en bewerkte publicatielijsten exporteren naar Batch Download, als een HitList, of als RIS citaties voor hun favoriete reference manager. Voor het Gene Report is een van de grootste uitdagingen het onderscheid tussen papers die zich op een gen concentreren en papers die er slechts in geringe mate naar verwijzen, bijvoorbeeld als één datapunt in een genoombrede analyse. Om de gebruiker te helpen de voor dat gen meest relevante artikels te identificeren, hebben we een sectie ‘representatieve publicaties’ ingevoerd. Deze categorie bevat tot 25 papers die FlyBase heeft geïdentificeerd als het meest informatief met betrekking tot de identificatie en functie van een bepaald gen. Om deze representatieve publicaties te identificeren, hebben we een algoritme ontwikkeld dat papers rangschikt volgens relevantie, gebaseerd op de hoeveelheid en de aard van de verzamelde gegevens voor het gegeven gen, waarbij vooral voorrang wordt gegeven aan papers die het gen vermelden in de titel of het abstract. De mogelijkheid om de meest informatieve papers te identificeren onder de honderden die een gen vermelden, samen met de andere sorteermogelijkheden van de referentiesectie, begint het probleem aan te pakken van het worstelen met de snel groeiende biologische literatuur.

Figuur 6.

Interactieve Referenties Sectie. Referentiesectie met opties om te filteren op publicatietypes (linker zijbalk), inclusief representatieve publicaties, en diverse sorteer-, zoek-, en exportopties.

Figuur 6.

Interactieve sectie Referenties. Rubriek Referenties met opties om te filteren op publicatietypes (linker zijbalk), inclusief representatieve publicaties, en diverse sorteer-, zoek-, en exportopties.

Een andere manier waarop FlyBase gebruikers probeert te helpen bij het vinden van relevante literatuur is de opname van ‘grafische samenvattingen’ – afbeeldingen die de bevindingen van een artikel samenvatten, een methode die een aantal jaren geleden voor het eerst door Cell Press werd geïntroduceerd. FlyBase heeft een overeenkomst gesloten met Cell Press om de grafische samenvattingen in het corresponderende referentierapport weer te geven. Thumbnails van deze grafische abstracts zijn ook opgenomen in panels voor referentie hitlijst items, indien beschikbaar. Door te klikken op de grafische samenvatting wordt de gebruiker doorverwezen naar de samenvatting en de paper bij Cell Press.

NIEUWE GENOME BROWSER TRACKS EN MIGRATIE VAN GBrowse NAAR JBrowse

Sinds een aantal jaren worden in de GBrowse genome browser in FlyBase geannoteerde genmodellen en vele andere in kaart gebrachte kenmerken van het genoom en epigenoom weergegeven, alle weergegeven als afzonderlijke ’tracks’ (15) Tracks die uniek zijn voor FlyBase omvatten signaalgrafieken van RNA-Seq van verschillende projecten gedurende de ontwikkelingstijd of in reactie op omgevingsstimuli en eiwitdomeinen die zijn uitgelijnd met de D. melanogaster genoom referentiestam (1). De informatie over eiwitdomeinen is uitgebreid met een nieuw spoor dat door SMART voorspelde domeinen toont, als aanvulling op het eerder geïmplementeerde ‘Pfam’-spoor, en dat een tweede onafhankelijk beeld geeft van welke eiwitdomeinen door een gen worden gecodeerd en hoe ze over de exonen zijn verdeeld (7,8). Gen en Polypeptide Rapporten bevatten ook schema’s van deze domeinen (zie Rapport verbeteringen, hierboven).

Hoewel GBrowse al vele jaren het FlyBase genoom browser platform is, zijn we met FlyBase 2.0 begonnen met het migreren van genoomsporen naar een volgende generatie genoom browser genaamd JBrowse (16). JBrowse heeft een aantal unieke functies die het genoom browsen gemak en functionaliteit te verbeteren, zoals een grotere snelheid en responsiviteit, configureerbare tracks, hetzelfde-scherm track selectie, en klik-en-sleep-navigatie. Op de meeste pagina’s met genoom-browser links in FlyBase 2.0 kunnen gebruikers momenteel kiezen tussen GBrowse en JBrowse. Zodra onze migratie naar JBrowse is voltooid, zal GBrowse worden afgeschreven maar nog een jaar toegankelijk zijn, waarna JBrowse de enige door FlyBase gehoste genoombrowser zal zijn. Naast de genoombrowsers op FlyBase hebben we onlangs in de sectie “other genome views” van het Gene Report links toegevoegd naar browsers bij NCBI, Ensembl, UCSC en PopFly, die verschillende annotaties en functionaliteiten hebben (figuur 4). De PopFly-browser bijvoorbeeld toont DNA-polymorfismen die zijn geïdentificeerd in natuurlijke populaties van D. melanogaster. FlyBase evalueert voortdurend nieuwe communautaire datasets voor opname in onze genoom-browsers. Huidige plannen omvatten verbeteringen aan de ontwikkeling proteoom annotatie en het toevoegen van locaties van efficiënte gRNA doel sites voor CRISPR engineering die zijn voorspeld door de Drsosophila RNAi Screening Center (DRSC) (https://fgr.hms.harvard.edu/) (17).

NIEUWE TOOLS VOOR POWER GEBRUIKERS

De bouw van FlyBase 2.0 bracht een belangrijke wijziging in de backend architectuur die nieuwe mogelijkheden voor ‘power users’ mogelijk maakte. We verbeterden de cloud compatibiliteit, voegden een application programming interface (API) toe (https://flybase.github.io/), en reorganiseerden de code fundamenteel om een meer modulaire structuur te hebben. We blijven een publiek toegankelijke Chado database ondersteunen (https://flybase.github.io/) en downloads van XML, FASTA, GFF, GTF, en andere bulk data bestanden via onze FTP site (ftp://ftp.flybase.org/).

CONNECTIES MET DE GEMEENSCHAP

FlyBase heeft veel baat bij een goed geëngageerde gebruikersgemeenschap. Sinds 2014 heeft de FlyBase Community Advisory Group (FCAG), een groep van meer dan 500 onderzoekers wereldwijd met een engagement om FlyBase te verbeteren, gereageerd op regelmatige enquêtes met informatie van onschatbare waarde over hoe onderzoekers FlyBase daadwerkelijk gebruiken, en suggesties voor nieuwe mogelijkheden. Deze feedback blijft vorm geven aan hoe FlyBase zich aanpast aan nieuwe gegevens en gebruikersbehoeften. Ons doel is om een vertegenwoordiger in FCAG te hebben van elk Drosophila lab; nieuwe vertegenwoordigers kunnen zich registreren door de FlyBase Community Advisory Group link te volgen onder het Community menu op FlyBase (http://flybase.org/wiki/FlyBase:Community_Advisory_Group). Een andere voortdurende inspanning is de productie van video tutorials, die in de laatste twee jaar is versneld met acht nieuwe video’s geplaatst op ons YouTube-kanaal (https://www.youtube.com/c/FlyBaseTV), waarin verschillende zoektechnieken, nieuwe functies van de FlyBase 2.0 website, en JBrowse worden behandeld. De nieuwe website toont ook de FlyBase Twitter feed (https://twitter.com/FlyBaseDotOrg) op de linker zijbalk van de homepage, die we gebruiken om gebruikers te waarschuwen voor nieuwe gegevens en functies en voor actueel nieuws dat relevant is voor de vliegengemeenschap.

KIJKEND NAAR DE TOEKOMST

Een uitdaging voor de toekomst zal zijn om gelijke tred te houden met de steeds snellere groei van biologische informatie, met inbegrip van de steeds grotere hoeveelheid big data van nieuwe high-throughput methoden. Een van deze nieuwe methoden is RNA-sequencing voor eencellige cellen (RNA-Seq), die hoeveelheden fijnkorrelige temporele en ruimtelijke informatie over genexpressie oplevert. Om het volledige potentieel van deze methode te benutten, is het absoluut noodzakelijk nieuwe benaderingen te ontwikkelen om de grote hoeveelheid gegevens te integreren en weer te geven in een interactief formaat dat zowel nuttig als gemakkelijk is. FlyBase zal doorgaan met het integreren van ontwikkelingsproteoom data als deze beschikbaar komen, en deze integreren met RNA-Seq data via grafische weergaven en JBrowse om een krachtig instrument voor functionele genomics te produceren. Toekomstige ontwikkeling van nieuwe interactieve displays voor paden en interacties tussen deze genproducten zal verder versterken van een systeembenadering voor het begrijpen van cellulaire netwerken. We voorzien ook de integratie van andere fundamenteel nieuwe dataklassen. Drosophila metabole paden en het microbioom, de populatie van micro-organismen in en op de vlieg. Aangezien de opbouw van FlyBase en andere MOD’s gencentrisch is geweest, zal de integratie van deze gegevens nieuwe uitdagingen met zich meebrengen en samenwerking met derden en koppelingen vereisen. Uiteraard zal het aangaan van al deze uitdagingen van groeiende biologische informatie afhangen van de beschikbaarheid van voldoende middelen.

FlyBase zal ook een actief lid blijven van de Alliance of Genome Resources (The Alliance; https://alliancegenome.org) (14). Dit omvat inspanningen om gegevens te homogeniseren en nieuwe displays en instrumenten te ontwikkelen voor fundamenteel en translationeel onderzoek. Een deel van deze inspanningen zal bestaan in de ontwikkeling van nieuwe API’s die krachtige gebruikers in staat stellen grote datasets die in de NIH Data Commons zijn gedeponeerd, op te vragen en ermee te werken. Dit zullen belangrijke toekomstige inspanningen zijn naarmate de stortvloed van big data en het belang van bio-informatica voor biomedisch onderzoek blijft toenemen.

In de afgelopen 27 jaar heeft FlyBase zich ontwikkeld van een eenvoudige database tot een krachtige kennisbank. Naast zijn essentiële rol van het cureren en verspreiden van fly gegevens, is FlyBase blijven ontwikkelen van nieuwe instrumenten voor de ontdekking van gen-functie in organismen en hun links naar de menselijke ziekte (18). FlyBase blijft van essentieel belang voor de ondersteuning van de talrijke soorten gegevens die specifiek zijn voor de vlieg onderzoeksgemeenschap, zodat het volledige potentieel van Drosophila voor biologische ontdekking en translationeel onderzoek kan worden gerealiseerd (19). Blijven bouwen op de FlyBase 2.0 kennisbasis zal verder machtigen de Drosophila gemeenschap om nieuwe ideeën te verkennen, om te zoeken naar nieuwe aspecten van het leven, en om moedig te gaan waar niemand is gegaan before.

ACKNOWLEDGEMENTS

We willen graag de andere PI’s, curatoren, en ontwikkelaars van FlyBase bedankt voor hun commentaar op het manuscript. Speciale dank gaat uit naar Julie Agapite en Victoria Jenkins voor hun uitgebreide redactionele bijdragen. Op het moment van schrijven waren de leden van het FlyBase Consortium Norbert Perrimon, Susan Russo Gelbart, Julie Agapite, Kris Broll, Lynn Crosby, Gilberto dos Santos, David Emmert, L. Sian Gramates, Kathleen Falls, Victoria Jenkins, Beverley Matthews, Carol Sutherland, Christopher Tabone, Pinglei Zhou, Mark Zytkovicz, Nick Brown, Giulia Antonazzo, Helen Attrill, Phani Garapati, Alex Holmes, Aoife Larkin, Steven Marygold, Gillian Millburn, Clare Pilgrim, Vitor Trovisco, Pepe Urbano, Thomas Kaufman, Brian Calvi, Bryon Czoch, Josh Goodman, Victor Strelets, Jim Thurmond, Richard Cripps, Phillip Baker.

FUNDING

FlyBase wordt gefinancierd door NIH, NHGRI ; UK Medical Research Council . Financiering voor open access charge: NIH, NHGRI .

Conflict of interest statement. Geen verklaard.

Gramates
L.S.

,

Marygold
S.J.

,

Santos
G.D.

,

Urbano
J.M.

,

Antonazzo
G.

,

Matthews
B.B.

,

Rey
A.J.

,

Tabone
C.J.

,

Crosby
M.A.

,

Emmert
D.B.

et al.

FlyBase at 25: looking to the future

.

Nucleic Acids Res.
2017

;

45

:

D663

D671

.

Cook
K.R.

,

Parks
A.L.

,

Jacobus
L.M.

,

Kaufman
T.C.

,

Matthews
K.A.
Nieuwe onderzoeksbronnen in het bloomington drosophila stock center

.

Vlieg

.

2010

;

4

:

88

91

.

Attrill
H.

,

Falls
K.

,

Goodman
J.L.

,

Millburn
G.H.

,

Antonazzo
G.

,

Rey
A.J.

,

S.J.
Marygold.
FlyBase Consortium
FlyBase: tot stand brengen van een Gene Group resource voor Drosophila melanogaster

.

Nucleic Acids Res.
2016

;

44

:

D786

D792

.

Lindsley
D.L.

,

Zimm
G.G.
The Genome of Drosophila Melanogaster

.

1992

;

San Diego

:

Academic Press

.

Smith
C.L.

,

Blake
J.A.

,

Kadin
J.A.

,

Richardson
J.E.

,

Bult
C.J.
Mouse Genome Database, G.
Mouse Genome Database (MGD)-2018: knowledgebase voor de laboratoriummuis

.

Nucleic Acids Res.
2018

;

46

:

D836

D842

.

The Gene Ontology Consortium
Expansion of the gene ontology knowledgebase and resources

.

Nucleic Acids Res.
2017

;

45

:

D331

D338

.

Finn
R.D.

,

Coggill
P.

,

Eberhardt
R.Y.

,

Eddy
S.R.

,

Mistry
J.

,

Mitchell
A.L.

,

Potter
S.C.

,

Punta
M.

,

Qureshi
M.

,

Sangrador-Vegas
A.

et al.

De Pfam-databank van eiwitfamilies: naar een duurzamere toekomst

.

Nucleic Acids Res.
2016

;

44

:

D279

D285

.

Letunic
I.

,

Bork
P.
20 jaar van de SMART eiwitdomein annotatiebron

.

Nucleic Acids Res.
2018

;

46

:

D493

D496

.

Zdobnov
E.M.

,

Tegenfeldt
F.

,

Kuznetsov
D.

,

Waterhouse
R.M.

,

Simao
F.A.

,

Ioannidis
P.

,

Seppey
M.

,

Loetscher
A.

,

Kriventseva
E.V.
OrthoDB v9.1: catalogisering van evolutionaire en functionele annotaties voor dierlijke, fungale, plantaardige, archeale, bacteriële en virale orthologs

.

Nucleic Acids Res.
2017

;

45

:

D744

D749

.

Hu
Y.

,

Flockhart
I.

,

Vinayagam
A.

,

Bergwitz
C.

,

Berger
B.

,

Perrimon
N.

,

Mohr
S.E.
Een integratieve benadering van ortholog-voorspelling voor op ziekte gerichte en andere functionele studies

.

BMC Bioinformatics

.

2011

;

12

:

357

.

Hu
Y.

,

Comjean
A.

,

Mohr
S.E.

,

FlyBase
C.

,

Perrimon
N.
Gene2Function: An integrated online resource for gene function discovery

.

2017

;

7

:

2855

2858

.

Hu
Y.

,

Vinayagam
A.

,

Nand
A.

,

Comjean
A.

,

Chung
V.

,

Hao
T.

,

Mohr
S.E.

,

Perrimon
N.
Molecular Interaction Search Tool (MIST): een geïntegreerde bron voor het ontginnen van gen- en eiwitinteractiegegevens

.

Nucleic Acids Res.
2018

;

46

:

D567

D574

.

Wang
J.

,

Al-Ouran
R.

,

Hu
Y.

,

Kim
S.Y.

,

Wan
Y.W.

,

Wangler
M.F.

,

Yamoto
S.

,

Chao
H.T.

,

Comjean
A.

,

Mohr
S.E.

et al.

MARRVEL: Integratie van menselijke genetische hulpbronnen en genetische hulpbronnen van modelorganismen om de functionele annotatie van het menselijk genoom te vergemakkelijken

.

Am. J. Hum. Genet.
2017

;

100

:

843

853

.

Howe
D.G.

,

Blake
J.A.

,

Bradford
Y.M.

,

Bult
C.J.

,

Calvi
B.R.

,

Engel
S.R.

,

Kadin
J.A.

,

Kaufman
T.C.

,

Kishore
R.

,

Laulederkind
S.J.F.

et al.

Modelorganism data evolving in support of translational medicine

.

Lab. Anim. (NY)

.

2018

;

47

:

277

289

.

Stein
L.D.
Using GBrowse 2.0 to visualize and share next-generation sequence data

.

Brief. Bioinform.
2013

;

14

:

162

171

.

Buels
R.

,

Yao
E.

,

Diesh
C.M.

,

Hayes
R.D.

,

Munoz-Torres
M.

,

Helt
G.

,

Goodstein
D.M.

,

Elsik
C.G.

,

Lewis
S.E.

,

Stein
L.

et al.

JBrowse: a dynamic web platform for genome visualization and analysis

.

Genome Biol.
2016

;

17

:

66

.

Mohr
S.E.

,

Hu
Y.

,

Ewen-Campen
B.

,

Housden
B.E.

,

Viswanatha
R.

,

Perrimon
N.
CRISPR gids-RNA ontwerp voor onderzoekstoepassingen

.

FEBS J.
2016

;

283

:

3232

3238

.

Wangler
M.F.

,

Yamamoto
S.

,

Bellen
H.J.
Fruitvliegen in biomedisch onderzoek

.

Genetics

.

2015

;

199

:

639

653

.

Bilder
D.

,

Irvine
K.D.
De balans opmaken van het ecosysteem van het Drosophila-onderzoek

.

Genetics

.

2017

;

206

:

1227

1236

.

Author notes

De leden van het FlyBase Consortium staan vermeld in de Acknowledgements.

© The Author(s) 2018. Gepubliceerd door Oxford University Press namens Nucleic Acids Research.
Dit is een Open Access-artikel dat wordt verspreid onder de voorwaarden van de Creative Commons Attribution License (http://creativecommons.org/licenses/by/4.0/), die onbeperkt hergebruik, distributie en reproductie in elk medium toestaat, mits het oorspronkelijke werk goed wordt geciteerd.

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.