FlyBase 2.0: nästa generation

Abstract

FlyBase (flybase.org) är en kunskapsdatabas som stödjer forskare som använder fruktflugan Drosophila melanogaster som modellorganism. FlyBase-teamet kurerar och organiserar ett brett utbud av genetisk, molekylär, genomisk och utvecklingsrelaterad information om Drosophila. I början av 2018 släpptes ”FlyBase 2.0” med ett avsevärt förbättrat användargränssnitt och nya verktyg. Bland dessa viktiga förändringar finns en ny organisation av sökresultat i interaktiva listor eller tabeller (hitlists), förbättrade referenslistor och ny grafik för proteindomäner. En viktig ny dataklass som kallas ”experimentella verktyg” konsoliderar information om användbara flugstammar och andra resurser som är relaterade till en specifik gen, vilket avsevärt förbättrar Drosophila-forskarens möjligheter att utforma och genomföra experiment. I och med lanseringen av FlyBase 2.0 har det också skett en omstrukturering av backend-arkitekturen och en fortsatt utveckling av gränssnitt för tillämpningsprogrammering (API) för programmerad åtkomst till FlyBase-data. I denna översikt beskriver vi dessa viktiga nya egenskaper och funktioner på FlyBase 2.0-webbplatsen och hur de stöder användningen av Drosophila som modellorganism för biologisk upptäckt och translationell forskning.

INLEDNING

FlyBase (flybase.org) är det viktigaste förvaringsregistret och webbportalen för genetiska data relaterade till Drosophila melanogaster, fruktflugan. FlyBase-konsortiet är ett team av kuratorer, utvecklare och utbildare på fyra platser: Harvard University, University of Cambridge, Indiana University och University of New Mexico. FlyBase innehåller data som kurerats från primär vetenskaplig litteratur som täcker mer än ett sekel av genetisk forskning. Under årens lopp har konsortiet utvecklat nya format för visning av data och nya bioinformatiska verktyg för att utvinna dessa data för biologisk upptäckt och translationell forskning. Dessa insatser har förvandlat FlyBase från en enkel databas till en kraftfull kunskapsbas.

Sajten FlyBase har genomgått stora förändringar sedan vår senaste granskning för två år sedan (1). I februari 2017 släppte vi en betaversion av nästa generations webbplats, som vi har döpt till ”FlyBase 2.0”. Efter en period av offentlig feedback och finslipning ersatte FlyBase 2.0 den tidigare webbplatsen i december 2017. I den här översynen kommer vi att diskutera vad som är annorlunda och bättre med denna nästa generations webbplats och vad du kan förvänta dig av ett besök på den nya och förbättrade FlyBase 2.0, nu och i framtiden. Även om vi fokuserar på de nya uppgifterna och verktygen i den här översynen har det skett några viktiga förändringar i användargränssnittet (UI) för FlyBase 2.0. Vi hänvisar den intresserade läsaren till den tidigare NAR-granskningen från 2017 för en utförlig diskussion om andra aspekter av FlyBase (1).

QuickSearch AND HITLISTS

Användningsstatistik visar att de flesta användare söker i FlyBase genom ”QuickSearch” på startsidan. I augusti 2017 lade FlyBase till fliken ”GAL4 etc” till ”QuickSearch”. Denna sökning svarade på ett långvarigt behov av ett hanterbart sätt att söka i FlyBase efter GAL4 och andra binära drivrutiner, samt lacZ- och GFP-rapportörer, med hjälp av olika typer av uttrycksmönster. Sökningen returnerar alleler, konstruktioner, infogningar och tillgängliga lager och har ett alternativ för att visa resultaten i associerade grupper (figur 1). Den markerar också några av de mest populära GAL4-drivrutinerna baserat på information om lagerbeställning från BDSC och antalet gånger de refereras i publikationer (2). Fliken ”GAL4 etc” innehåller också en länk till en omfattande lista över dessa ”ofta använda” GAL4-drivrutiner.

Figur 1.

GAL4-sökresultat. En resultattabell för en sökning med hjälp av fliken ”GAL4 etc.” QuickSearch, med alternativet ”integrerad tabell” valt. Korshänvisningar används för att gruppera associerade alleler, konstruktioner, insättningar och bestånd tillsammans. Två ”ofta använda” GAL4-drivrutiner är markerade.

Figur 1.

GAL4-sökresultat. En resultattabell för en sökning med hjälp av fliken ”GAL4 etc.” QuickSearch, med alternativet ”integrerad tabell” valt. Korshänvisningar används för att gruppera associerade alleler, konstruktioner, insättningar och bestånd tillsammans. Två ”ofta använda” GAL4-drivare är markerade.

Och även om QuickSearch har flera flikar för specifika sökningar använder de flesta människor den generiska fliken ”Search FlyBase”. Med tanke på betydelsen av denna ingångspunkt har vi ägnat en stor del av våra ansträngningar åt att i grunden förändra och förbättra de ”träfflistor” som returneras av denna sökning för FlyBase 2.0, genom att dra full nytta av den nya webbplatsarkitekturen (figur 2). Förbättringar av användargränssnittet på resultatsidan för träfflistan omfattar en ”responsiv” layout för visning på små skärmar (t.ex. smartphones), paginering för att minska laddningstiderna och ett inbäddat nytt sökformulär.

Figur 2.

Träfflista för sökresultat. Resultatsidan för Search FlyBase med ”Mad” som sökbegrepp. En ”träfflista” visas som innehåller gener, bestånd, alleler och många andra klasser av FlyBase-dataelement (vissa visas inte). Knappen Mad-genrapport är markerad med en blå flagga, vilket indikerar nya annotationer i den aktuella versionen; om man rör musen över flaggan visas en sammanfattning. Listan är inramad med en rad verktyg för filtrering efter dataklass och art, paginering, visning och analys.

Figur 2.

Sökresultatets träfflista. Resultatsidan för Search FlyBase med ”Mad” som sökbegrepp. En ”träfflista” visas som innehåller gener, bestånd, alleler och många andra klasser av FlyBase-dataelement (vissa visas inte). Knappen Mad-genrapport är markerad med en blå flagga, vilket indikerar nya annotationer i den aktuella versionen; om man rör musen över flaggan visas en sammanfattning. Listan är inramad med en rad verktyg för filtrering efter dataklass och art, paginering, visning och analys.

En viktig egenskap hos den nya träfflistan är att den är ”blandad”, det vill säga innehåller alla klasser av FlyBase-data som matchar sökbegreppet. Varje matchande objekt finns i en panel som innehåller ett kortfattat urval av viktig information (figur 2). Färgkodade märken längs den högra marginalen gör det möjligt att snabbt skanna av objekt efter dataklass (figur 2). En blå flagga visar att nya data har bifogats till ett objekt i den senaste versionen av FlyBase (figur 2). Knappar länkar till FlyBase-rapporter, genombläddrare eller nya träfflistor med relaterade objekt, t.ex. kommer en panel för en viss gen att innehålla knappar för associerade alleler, bestånd, transkript, polypeptider och referenser (figur 2). Varje panel för dataklass innehåller också klassspecifik information; till exempel kommer en panel för en allel att visa det mutagen som använts för att generera allelen, eventuella associerade insättningar och antalet fenotyputlåtanden som är kopplade till allelen.

Den blandade träfflistan kan filtreras efter art eller efter dataklass (figur 2). Med artfiltret kan du välja om du vill inkludera/exkludera humana transgener i flugor, liksom resultat från icke-melanogaster eller icke-Drosophila. Dataklassfiltren kan ställas in för att visa en smalare träfflista som består av några få dataklasser av intresse eller en enda dataklass. Om man begränsar sökresultaten till en enda dataklass kan man använda verktyg och visningsalternativ för en enda klass. Observera att de flesta flikarna i QuickSearch-verktyget genererar träfflistor med en enda dataklass direkt.

När träfflistan filtreras till en enda dataklass blir ett ”tabell”-vynsalternativ tillgängligt. Tabellvyn är en vertikalt kompakt tabellvy med sorteringsbara kolumner som är lämpliga för den aktuella klassen (figur 3). En uppsättning analysverktyg blir tillgängliga när en träfflista omfattar en enda dataklass. Verktygen visas högst upp på sidan med träfflistan som en rad knappar märkta ”Convert”, ”Export” och ”Analyze” (figur 3). Knappen Convert drivs av de omfattande korshänvisningarna mellan dataklasserna, vilket gör att du till exempel kan förvandla en lista med gener till en lista med relaterade referenser, eller en lista med alleler till en lista med associerade infogningar. Knappen Export tar den aktuella träfflistan till något av flera FlyBase-verktyg, t.ex. Batch Download eller Feature Mapper. Detta är också det bästa sättet att ladda ner en träfflista som en uppsättning FlyBase-ID:er. Knappen Analyze kan generera flera typer av korta rapporter som sammanfattar träfflistan, t.ex. frekvenser av anatomiska termer eller fenotypiska klasser för en allelträfflista, eller kan dirigera träfflistan till verktyget Interactions Browser. Med dessa förbättringar har träfflistan blivit ett kraftfullt verktyg för att granska, förfina och analysera FlyBase-sökresultat.

Figur 3.

Tabellvy av träfflistan för sökresultat. Sidan med sökresultatet ”Mad”, filtrerad till dataklassen Allele och med tabellvy. Menyn för exportverktyget har utökats.

Figur 3.

Tabellvy av träfflistan med sökresultat. Sidan med sökresultatet ”Mad”, filtrerad till dataklassen Allel och med tabellvy. Menyn för exportverktyget har utökats.

RAPPORTSFÖRBÄTTRINGAR

Det har gjorts flera anmärkningsvärda ändringar i FlyBase-rapporterna som förbättrar användbarheten och förbättrar datavisningen. Till exempel har alla rapporter nu en navigeringspanel till höger på sidan (figur 4). Denna panel innehåller länkar till alla de översta sektionerna i rapporten och kan användas för att snabbt hoppa till sektioner av intresse. Avsnittet ”Referenser” i alla rapporter har förbättrats för att göra det lättare att filtrera och sortera genom listor över publikationer (se avsnittet ”Interaktiva referenser och grafiska sammanfattningar” nedan för mer information).

Figur 4.

FlyBase Gene Report. FlyBase Gene Report för Cdk1-genen. Avsnittet Allmän information fungerar som en ”superöversikt” över geninformationen. Menyn ”Report Sections” till höger flyter när användaren bläddrar i rapporten, vilket ger ett enkelt navigeringsverktyg. Avsnittet Genomic Location innehåller externa länkar till genombrowsers på NCBI, Ensembl, UCSC och PopFly.

Figur 4.

FlyBase Gene Report. FlyBase Gene Report för Cdk1-genen. Avsnittet Allmän information fungerar som en ”superöversikt” över geninformationen. Menyn ”Report Sections” till höger flyter när användaren bläddrar i rapporten, vilket ger ett enkelt navigeringsverktyg. Avsnittet Genomic Location innehåller externa länkar till genombläddrarna på NCBI, Ensembl, UCSC och PopFly.

Sammanfattad funktionell information om gener är viktig för våra webbplatsanvändare, särskilt för dem som är involverade i translationell forskning. Under de senaste åren har det översta avsnittet ”General Information” i FlyBase Gene Reports utvecklats till en ”superresumé”, som omfattar en mängd olika översiktsdata om gener (figur 4). I FlyBase 2.0 omfattar detta en Gen Snapshot, en automatiskt genererad sammanfattning, beskrivningen av den gengrupp som genen tillhör (3), UniProt-funktionsdata, historisk Red Book-information (4) och en sammanfattning från Interactive Fly (http://www.sdbonline.org/fly/aimain/1aahome.htm), när dessa finns tillgängliga. Gene Snapshots är handskrivna sammanfattningar som begärs in från forskare med sakkunskap om den genen och ger en snabb översikt över vad som är känt om den genens funktion (1).

En annan användbar sammanfattning i FlyBase 2.0 Gene Reports är ”GO summary ribbon” (Figur 5). Dessa band har tidigare implementerats i Mouse Genome Database (MGD) (5) och visar grafiskt en destillation på högsta nivå av Gene Ontology (GO)-termer (6). Detta band använder Ontologins hierarkiska struktur för att koncentrera GO-kureringen till några dussin termer på hög nivå, som sedan visas med färgintensitetschips som anger antalet annoteringar. Mer specifika termer visas som en popup-fönsterruta genom att man för musen över en enskild cell, eller kan visas i tabellform i rapportens Gene Ontology-avsnitt. GO-bandet förbättrar avsevärt forskarens förmåga att snabbt bedöma vad som är känt om en gens funktion.

Figur 5.

GO Summary Ribbon. GO-sammanfattningsband för D. melanogaster-genen Cdk1, inbäddad i en FlyBase Gene Report.

Figur 5.

GO-sammanfattningsband. GO-sammanfattningsband för D. melanogaster-genen Cdk1, inbäddad i en FlyBase-genrapport.

FlyBase 2.0 Gene Reports innehåller nu grafik för proteindomäner från två InterPro-datakällor, Pfam och SMART, där sådana finns tillgängliga (7,8). Polypeptidrapporterna visar domäninformation för den specifika isoformen medan genrapporterna visar den längsta isoformen. Popup-fönster och tabeller med muspekare visar mer detaljerade domänuppgifter och innehåller länkar till InterPro-rapporter. Dessa visningar kompletterar spåren i genombrowsers som visar samma data som anpassats till genmodeller (se nedan).

EXPERIMENTALA VERKTYG

En oumbärlig funktion för FlyBase är att vara en källa till information om flugstammar och reagenser för att utforma experiment. Vikten av denna funktion betonades i en undersökning av FlyBase 2012 där ∼90 % av de svarande sade att de antingen tycker att FlyBase är ”mycket användbart” eller att de ”inte skulle kunna göra det utan FlyBase”. För detta ändamål har vi skapat en ny dataklass ”Experimental Tool”. Rapporterna beskriver verktyg som används för att upptäcka genprodukter (t.ex. FLAG-tagg, EGFP), subcellulär målinriktning (t.ex. signal för nukleär lokalisering, signalsekvens), uttryck i ett binärt system (t.ex. UAS, GAL4) eller klonalt/villkorligt uttryck (t.ex. FLP, FRT). Varje rapport om experimentella verktyg innehåller en beskrivning av verktyget och dess användningsområden, tillsammans med bläddringsbara tabeller med relaterade transgena konstruktioner. Dessa tabeller innehåller en förteckning över konstruktionskomponenterna (t.ex. regulatorisk region, kodad produkt), transgena alleler och konstruktioner, som alla är kopplade till bestånd så att forskarna lätt kan identifiera användbara flugstammar. För att lättare hitta dessa verktyg visas de också i de relevanta allel- och konstruktionsrapporterna, och den nya dataklassen för experimentella verktyg har lagts till i de interaktiva träfflistorna. Denna nya dataklass för experimentella verktyg förstärker ytterligare FlyBase som en viktig resurs för Drosophilaforskning.

MULTI-SPECIES MINING AND TRANSLATIONAL RESEARCH

I ett antal år har FlyBase varit värd för data och utvecklat verktyg för att identifiera ortologer av fluggener i flera organismer. Detta har omfattat ortologidata från OrthoDB (https://www.orthodb.org/, PMID:27899580) (9) och metaanalyser från DIOPT (https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl) (10). OrthoDB:s ortologiupprop i FlyBase uppdaterades 2017 och omfattar nu många Drosophila-arter, andra insekter och många andra arter. Förutom länkar till den ortologiska genen innehåller Gene Reports nu länkar till OrthoDB-grupper, vilket gör det möjligt för användaren att identifiera ortologer i upp till 5 000 arter.

DIOPT är en metaanalys av många olika algoritmer för prediktion av ortologi (inklusive OrthoDB), nyligen uppdaterad 2018 för att inkludera Arabidopsis thaliana och tre nya prediktionsalgoritmer. I FlyBase Gene Reports aggregeras DIOPT- och OrthoDB-ortologikallelser mellan Drosophila melanogaster och en kärnuppsättning av andra arter av modellorganismer i en kompakt visning för att producera en informativ sammanfattning. I detta avsnitt visas också länkar till proteinanpassningen med den förutspådda ortologen, och det anges om den mänskliga ortologen, när den överförs till Drosophila, funktionellt kompletterar flugmutanten.

FlyBase 2.0 har samarbetat med grupperna Norbert Perrimon och Hugo Bellen för att utveckla nya online-verktyg som gör det möjligt att söka efter ortologiskt geners funktion (Gene2Function;http://gene2function.org) (11), bevarande av fosforyleringsställen och andra posttranslationella modifieringar av proteiner (https://www.flyrnai.org/tools/iproteindb/web/) (bioRxiv https://doi.org/10.1101/310854), geninteraktioner mellan organismer (MIST;http://fgrtools.hms.harvard.edu/mist) (12), och ett sökverktyg som returnerar diverse information om ortologer, mänsklig genetik och sjukdomar (MARRVEL;http://marrvel.org) (13). Dessa och andra användbara länkar till externa resurser finns som ikoner i sidofältet på FlyBase-hemsidan. Detta är bara några exempel på hur FlyBase fortsätter att samarbeta med tredje part för att utveckla nya verktyg och stödja Drosophila-samhällets grundläggande upptäckter och translationella forskning.

Under de senaste åren har FlyBase-konsortiet ökat sitt deltagande i The Alliance of Genome Resources (The Alliance;https://alliancegenome.org) (14). Alliansen är ett samarbete för att konsolidera och homogenisera presentationen av data från olika modellorganismer och integrera den med data från människor för att påskynda biologiska upptäckter och translationell forskning. Alliansen utgör för närvarande ett samarbete mellan sex databaser för modellorganismer (Saccharomyces Genome Database, WormBase, FlyBase, Zebrafish Information Network, Mouse Genome Database, Rat Genome Database) och projektet Gene Ontology (GO). Alliansens verksamhet är en del av NIH Common Fund’s Big Data to Knowledge (https://commonfund.nih.gov/bd2k) Program, där ett viktigt mål är utvecklingen av en ”Data Commons” (https://commonfund.nih.gov/commons). Denna Data Commons kommer att vara ett arkiv för stora data som genereras av NIH-finansierad forskning, med lämpliga API:er som säkerställer att de är tillgängliga för alla i ett format som är sökbart, tillgängligt, interoperabelt och återanvändbart (FAIR). Under de senaste två åren har FlyBase tillhandahållit stora datamängder till Data Commons och utvecklat API:er för att underlätta användningen av dem. Data Commons pilotfas är en del av NIH:s strategiska plan för datavetenskaphttps://www.nih.gov/news-events/news-releases/nih-releases-strategic-plan-data-science för att utveckla nya metoder för att lagra, dela och analysera NIH:s datamängder i molnmiljön. För mer information om dessa program, alliansen och FlyBases roll i dem hänvisar vi läsaren till en nyligen publicerad omfattande översikt (14).

INTERACTIVE REFERENCES AND GRAPHICAL ABSTRACTS

Nästan alla rapportsidor i FlyBase har ett avsnitt ”Referenser” som innehåller en lista över publikationer som är kopplade till den givna enheten (gen, allel, insättning etc.). Detta avsnitt har förbättrats i FlyBase 2.0 med ett interaktivt sidofält som gör det möjligt för användaren att filtrera efter publikationstyp, t.ex. ”research paper” eller ”review” (figur 6). Användaren kan också sortera efter år eller författare, söka efter text och exportera redigerade publikationslistor till Batch Download, som en HitList eller som RIS-citat för sin favoritreferenshanterare. För Gene Report är en av de ökande utmaningarna att skilja mellan artiklar som fokuserar på en gen och de som endast har en mindre referens till den, till exempel som en datapunkt i en genomövergripande analys. För att hjälpa användaren att identifiera de artiklar som är mest relevanta för den genen har vi infört ett avsnitt ”representativ publikation”. Denna kategori innehåller upp till 25 artiklar som FlyBase har identifierat som mest informativa när det gäller identifiering och funktion av en viss gen. För att identifiera dessa representativa publikationer har vi utvecklat en algoritm som rangordnar artiklarna efter relevans, baserat på mängden och arten av data som kurerats för den givna genen, och som särskilt prioriterar artiklar som nämner genen i titeln eller sammanfattningen. Möjligheten att identifiera de mest informativa artiklarna bland de hundratals som nämner en gen, tillsammans med de andra sorteringsmöjligheterna i referenssektionen, börjar lösa problemet med att ta itu med den snabbt växande biologiska litteraturen.

Figur 6.

Interaktiv referenssektion. Referenssektionen med alternativ för filtrering av publikationstyper (vänster sidofält), inklusive representativa publikationer, och olika sorterings, sök- och exportalternativ.

Figur 6.

Interaktiv referenssektion. Referenssektionen med alternativ för filtrering efter publikationstyper (vänster sidofält) inklusive representativa publikationer och olika sorterings, sök- och exportalternativ.

Ett annat sätt för FlyBase att hjälpa användarna att hitta relevant litteratur är att inkludera ”grafiska sammanfattningar” – bilder som sammanfattar resultaten av en artikel, som introducerades för första gången av Cell Press för ett antal år sedan. FlyBase har ingått ett avtal med Cell Press om att visa de grafiska sammanfattningarna i motsvarande referensrapport. Miniatyrbilder av dessa grafiska sammanfattningar ingår också i paneler för referenshitlistor, när sådana finns tillgängliga. Genom att klicka på den grafiska sammanfattningen hänvisas användaren till sammanfattningen och artikeln hos Cell Press.

NY GENOMBROWSER TRACKS AND MIGRATION FROM GBrowse To JBrowse

I ett antal år har GBrowse-genombrowsern i FlyBase visat annoterade genmodeller och många andra kartlagda egenskaper hos genomet och epigenomet, som alla visats som separata ”spår” (15) Spår som är unika för FlyBase är bl.a. signaldiagram av RNA-Seq från olika projekt under utvecklingstiden eller som svar på miljöstimulanser och proteindomäner som anpassats till D. melanogaster-genom referensstam (1). Informationen om proteindomäner har förbättrats med ett nytt spår som visar domäner som förutsägs av SMART, vilket kompletterar det tidigare implementerade ”Pfam”-spåret och ger en andra oberoende bild av vilka proteindomäner som kodas av en gen och hur de är fördelade mellan exoner (7,8). Gen- och polypeptidrapporter innehåller också scheman över dessa domäner (se Förbättringar av rapporter, ovan).

Men GBrowse har varit FlyBases genomwebbläsarplattform i många år, men i och med FlyBase 2.0 har vi börjat migrera genomspåren till en nästa generations genomwebbläsare som kallas JBrowse (16). JBrowse har ett antal unika funktioner som förbättrar enkelheten och funktionaliteten vid genombläddring, t.ex. högre hastighet och responsivitet, konfigurerbara spår, val av spår på samma skärm och navigering genom att klicka och dra. På de flesta sidor med länkar till genombrowser i FlyBase 2.0 kan användaren för närvarande välja mellan GBrowse och JBrowse. När vår övergång till JBrowse är klar kommer GBrowse att avvecklas men fortfarande vara tillgänglig i ett år, varefter JBrowse kommer att vara den enda genomwebbläsaren i FlyBase. Förutom genombläddrarna på FlyBase har vi nyligen lagt till länkar i avsnittet ”other genome views” i Gene Report till bläddrarna på NCBI, Ensembl, UCSC och PopFly, som har olika annotationer och funktioner (figur 4). PopFly-webbläsaren visar till exempel DNA-polymorfismer som identifierats i naturliga populationer av D. melanogaster. FlyBase utvärderar kontinuerligt nya datamängder för att inkludera dem i våra genombläddrar. Aktuella planer omfattar förbättringar av annoteringen av utvecklingsproteomen och tillägg av platser för effektiva gRNA-målplatser för CRISPR-teknik som har förutsagts av Drsosophila RNAi Screening Center (DRSC) (https://fgr.hms.harvard.edu/) (17).

NYA VERKTYG FÖR KRAFTANVÄNDARE

Uppbyggnaden av FlyBase 2.0 medförde en betydande förändring av backend-arkitekturen som möjliggjorde nya möjligheter för ”kraftanvändare”. Vi förbättrade molnkompatibiliteten, lade till ett gränssnitt för tillämpningsprogrammering (API) (https://flybase.github.io/) och omorganiserade koden i grunden för att få en mer modulär struktur. Vi fortsätter att stödja en offentligt tillgänglig Chado-databas (https://flybase.github.io/) och nedladdningar av XML-, FASTA-, GFF-, GTF- och andra bulkdatafiler via vår FTP-webbplats (ftp://ftp.flybase.org/).

KONTAKTER TILL GEMENSKAPEN

FlyBase gynnas i hög grad av en välengagerad användargrupp. Sedan 2014 har FlyBase Community Advisory Group (FCAG), en grupp med över 500 forskare världen över som vill förbättra FlyBase, svarat på regelbundna undersökningar med ovärderlig information om hur forskare faktiskt använder FlyBase och förslag på nya funktioner. Denna feedback fortsätter att forma hur FlyBase anpassas till nya data och användarbehov. Vårt mål är att ha en representant i FCAG från varje Drosophila-laboratorium; nya representanter kan registrera sig genom att följa länken FlyBase Community Advisory Group under menyn Community på FlyBase (http://flybase.org/wiki/FlyBase:Community_Advisory_Group). Ett annat pågående arbete är produktionen av videohandledningar, som har accelererat under de senaste två åren med åtta nya videor som lagts ut på vår YouTube-kanal (https://www.youtube.com/c/FlyBaseTV) och som täcker olika söktekniker, nya funktioner på FlyBase 2.0-webbplatsen och JBrowse. På den nya webbplatsen visas också FlyBase Twitter-flöde (https://twitter.com/FlyBaseDotOrg) i vänster sidofält på startsidan, som vi använder för att uppmärksamma användarna på nya data och funktioner och på aktuella nyheter som är relevanta för fluggemenskapen.

LÄGGNINGAR TILL FRAMTIDEN

En framtida utmaning kommer att bli att hålla jämna steg med den accelererande tillväxten av biologisk information, inklusive den ständigt ökande mängden stora data från nya metoder med höggenomströmning. Bland dessa nya metoder finns RNA-sekvensering (RNA-Seq) av enstaka celler, som ger mängder av finkornig tidsmässig och rumslig information om genuttryck. För att utnyttja den fulla potentialen hos denna metod är det absolut nödvändigt att utveckla nya metoder för att integrera och visa den stora mängden data i ett interaktivt format som är både användbart och enkelt. FlyBase kommer att fortsätta att integrera utvecklingsproteomdata allteftersom de blir tillgängliga och integrera dem med RNA-Seq-data via grafiska displayer och JBrowse för att skapa ett kraftfullt verktyg för funktionell genomik. Framtida utveckling av nya interaktiva displayer för vägar och interaktioner mellan dessa genprodukter kommer att ytterligare stärka en systemansats för att förstå cellulära nätverk. Vi planerar också att integrera andra fundamentalt nya dataklasser. Bland dessa finns metaboliska vägar i Drosophila och mikrobiomet, dvs. populationen av mikroorganismer i och på flugan. Med tanke på att konstruktionen av FlyBase och andra MOD har varit gencentrerad kommer integreringen av dessa data att innebära nya utmaningar och kommer att kräva samarbete med tredje part och länkningar. Att möta alla dessa utmaningar med växande biologisk information kommer naturligtvis att bero på tillgången till tillräckliga resurser.

FlyBase kommer också att fortsätta som en aktiv medlem i Alliance of Genome Resources (The Alliance; https://alliancegenome.org) (14). Detta kommer att omfatta insatser för att homogenisera data och utveckla nya displayer och verktyg för grundforskning och translationell forskning. En del av dessa insatser kommer att vara skapandet av nya API:er som gör det möjligt för avancerade användare att hämta och arbeta med stora datamängder som deponerats i NIH Data Commons. Detta kommer att vara viktiga framtida insatser eftersom strömmen av stora data och bioinformatikens betydelse för biomedicinsk forskning fortsätter att öka.

Under de senaste 27 åren har FlyBase utvecklats från en enkel databas till en kraftfull kunskapsbas. Förutom sin viktiga roll som kurator och spridare av flygdata fortsätter FlyBase att utveckla nya verktyg för att upptäcka geners funktion i olika organismer och deras kopplingar till mänskliga sjukdomar (18). FlyBase förblir viktig för att stödja de många datatyper som är specifika för forskarsamhället kring flugor, så att Drosophilas fulla potential för biologisk upptäckt och translationell forskning kan förverkligas (19). Att fortsätta att bygga på kunskapsbasen FlyBase 2.0 kommer att ytterligare ge Drosophila-samhället möjlighet att utforska nya idéer, söka efter nya aspekter av livet och djärvt gå dit ingen har gått förut.

ACKNEDLEDGEMENTS

Vi vill tacka de andra projektledarna, kuratorerna och utvecklarna av FlyBase för deras kommentarer till manuskriptet. Ett särskilt tack till Julie Agapite och Victoria Jenkins för deras omfattande redaktionella bidrag. När detta skrevs var medlemmarna i FlyBase-konsortiet bl.a. följande: Norbert Perrimon, Susan Russo Gelbart, Julie Agapite, Kris Broll, Lynn Crosby, Gilberto dos Santos, David Emmert, L. Sian Gramates, Kathleen Falls, Victoria Jenkins, Beverley Matthews, Carol Sutherland, Christopher Tabone, Pinglei Zhou, Mark Zytkovicz, Nick Brown, Giulia Antonazzo, Helen Attrill, Phani Garapati, Alex Holmes, Aoife Larkin, Steven Marygold, Gillian Millburn, Clare Pilgrim, Vitor Trovisco, Pepe Urbano, Thomas Kaufman, Brian Calvi, Bryon Czoch, Josh Goodman, Victor Strelets, Jim Thurmond, Richard Cripps, Phillip Baker.

FINANsiering

FlyBase finansieras av NIH, NHGRI ; UK Medical Research Council . Finansiering av avgift för öppen tillgång: NIH, NHGRI .

Intressekonflikter. Inga deklarerade.

Gramates
L.S.

,

Marygold
S.J.

,

Santos
G.D.

,

Urbano
J.M.

,

Antonazzo
G.

,

Matthews
B.B.

,

Rey
A.J.

,

Tabone
C.J.

,

Crosby
M.A.

,

Emmert
D.B.

et al.

FlyBase at 25: looking to the future

.

Nucleic Acids Res.
2017

;

45

:

D663

D671

.

Cook
K.R.

,

Parks
A.L.

,

Jacobus
L.M.

,

Kaufman
T.C.

,

Matthews
K.A.
Nya forskningsresurser vid bloomington drosophila stock center

.

Fly

.

2010

;

4

:

88

91

.

Attrill
H.

,

Falls
K.

,

Goodman
J.L.

,

Millburn
G.H.

,

Antonazzo
G.

,

Rey
A.J.

,

S.J.
Marygold.
FlyBase Consortium
FlyBase: establishing a Gene Group resource for Drosophila melanogaster

.

Nucleic Acids Res.
2016

;

44

:

D786

D792

.

Lindsley
D.L.

,

Zimm
G.G.
Det genetiska systemet hos Drosophila Melanogaster

.

1992

;

San Diego

:

Academic Press

.

Smith
C.L.

,

Blake
J.A.

,

Kadin
J.A.

,

Richardson
J.E.

,

Bult
C.J.
Mouse Genome Database, G.
Mouse Genome Database (MGD)-2018: knowledgebase for the laboratory mouse

.

Nucleic Acids Res.
2018

;

46

:

D836

D842

.

The Gene Ontology Consortium
Expansion av kunskapsbasen och resurserna för genontologi

.

Nucleic Acids Res.
2017

;

45

:

D331

D338

.

Finn
R.D.

,

Coggill
P.

,

Eberhardt
R.Y.

,

Eddy
S.R.

,

Mistry
J.

,

Mitchell
A.L.

,

Potter
S.C.

,

Punta
M.

,

Qureshi
M.

,

Sangrador-Vegas
A.

et al.

The Pfam protein families database: towards a more sustainable future

.

Nucleic Acids Res.
2016

;

44

:

D279

D285

.

Letunic
I.

,

Bork
P.
20 år med SMART-resursen för annotation av proteindomäner

.

Nucleic Acids Res.
2018

;

46

:

D493

D496

.

Zdobnov
E.M.

,

Tegenfeldt
F.

,

Kuznetsov
D.

,

Waterhouse
R.M.

,

Simao
F.A.

,

Ioannidis
P.

,

Seppey
M.

,

Loetscher
A.

,

Kriventseva
E.V.
OrthoDB v9.1: katalogisering av evolutionära och funktionella annotationer för ortologer från djur, svampar, växter, arkealier, bakterier och virus

.

Nucleic Acids Res.
2017

;

45

:

D744

D749

.

Hu
Y.

,

Flockhart
I.

,

Vinayagam
A.

,

Bergwitz
C.

,

Berger
B.

,

Perrimon
N.

,

Mohr
S.E.
En integrativ metod för förutsägelse av ortologer för sjukdomsfokuserade och andra funktionella studier

.

BMC Bioinformatics

.

2011

;

12

:

357

.

Hu
Y.

,

Comjean
A.

,

Mohr
S.E.

,

FlyBase
C.

,

Perrimon
N.
Gene2Function: En integrerad online-resurs för upptäckt av genfunktioner

.

2017

;

7

:

2855

2858

.

Hu
Y.

,

Vinayagam
A.

,

Nand
A.

,

Comjean
A.

,

Chung
V.

,

Hao
T.

,

Mohr
S.E.

,

Perrimon
N.
Molecular Interaction Search Tool (MIST): en integrerad resurs för utvinning av data om gen- och proteininteraktion

.

Nucleic Acids Res.
2018

;

46

:

D567

D574

.

Wang
J.

,

Al-Ouran
R.

,

Hu
Y.

,

Kim
S.Y.

,

Wan
Y.W.

,

Wangler
M.F.

,

Yamamamoto
S.

,

Chao
H.T.

,

Comjean
A.

,

Mohr
S.E.

et al.

MARRVEL: Integration av genetiska resurser från människor och modellorganismer för att underlätta funktionell annotering av det mänskliga genomet

.

Am. J. Hum. Genet.
2017

;

100

:

843

853

.

Howe
D.G.

,

Blake
J.A.

,

Bradford
Y.M.

,

Bult
C.J.

,

Calvi
B.R.

,

Engel
S.R.

,

Kadin
J.A.

,

Kaufman
T.C.

,

Kishore
R.

,

Laulederkind
S.J.F.

et al.

Modellorganismdata som utvecklas för att stödja translationell medicin

.

Lab. Anim. (NY)

.

2018

;

47

:

277

289

.

Stein
L.D.
Användning av GBrowse 2.0 för att visualisera och dela nästa generations sekvensdata

.

Brev. Bioinform.
2013

;

14

:

162

171

.

Buels
R.

,

Yao
E.

,

Diesh
C.M.

,

Hayes
R.D.

,

Munoz-Torres
M.

,

Helt
G.

,

Goodstein
D.M.

,

Elsik
C.G.

,

Lewis
S.E.

,

Stein
L.

et al.

JBrowse: en dynamisk webbplattform för visualisering och analys av genomet

.

Genome Biol.
2016

;

17

:

66

.

Mohr
S.E.

,

Hu
Y.

,

Ewen-Campen
B.

,

Housden
B.E.

,

Viswanatha
R.

,

Perrimon
N.
CRISPR guide RNA design for research applications

.

FEBS J.
2016

;

283

:

323232

3238

.

Wangler
M.F.

,

Yamamamoto
S.

,

Bellen
H.J.
Fruktflugor inom biomedicinsk forskning

.

Genetics

.

2015

;

199

:

639

653

.

Bilder
D.

,

Irvine
K.D.
Taking stock of the Drosophila research ecosystem

.

Genetics

.

2017

;

206

:

1227

1236

.

Författarnotiser

Medlemmarna i FlyBase-konsortiet är listade i Tacksamtalen.

© Författaren/författarna 2018. Publicerad av Oxford University Press på uppdrag av Nucleic Acids Research.
Detta är en Open Access-artikel som distribueras enligt villkoren i Creative Commons Attribution License (http://creativecommons.org/licenses/by/4.0/), som tillåter obegränsad återanvändning, distribution och reproduktion i vilket medium som helst, under förutsättning att originalverket är korrekt citerat.

Lämna ett svar

Din e-postadress kommer inte publiceras.