FlyBase 2.0: a következő generáció

Abstract

A FlyBase (flybase.org) egy olyan tudásbázis, amely a gyümölcslégyet, a Drosophila melanogastert modellszervezetként használó kutatók közösségét támogatja. A FlyBase csapata a Drosophilára vonatkozó genetikai, molekuláris, genomikai és fejlődési információk sokrétű tárházát kurátorkodik és rendszerezi. 2018 elején jelent meg a “FlyBase 2.0”, amely jelentősen továbbfejlesztett felhasználói felülettel és új eszközökkel rendelkezik. E fontos változások közé tartozik a keresési eredmények interaktív listákba vagy táblázatokba (találati listák) történő új szervezése, a továbbfejlesztett referencialisták és az új fehérjetartomány-grafikák. Egy fontos új adatosztály, az “experimental tools” a hasznos légytörzsekről és más, egy adott génhez kapcsolódó forrásokról szóló információkat foglalja össze, ami jelentősen javítja a Drosophila-kutatók képességét a kísérletek megtervezésében és elvégzésében. A FlyBase 2.0 kiadásával a backend architektúra átalakítására és a FlyBase adataihoz való programozható hozzáférést biztosító alkalmazásprogramozási interfészek (API-k) folyamatos fejlesztésére is sor került. Ebben az áttekintésben ismertetjük a FlyBase 2.0 oldal ezen főbb új jellemzőit és funkcióit, valamint azt, hogy ezek hogyan támogatják a Drosophila mint modellorganizmus használatát a biológiai felfedezés és a transzlációs kutatás számára.

BEVEZETÉS

A FlyBase (flybase.org) a Drosophila melanogaster, a gyümölcslégy genetikai adatainak fő adattára és internetes portálja. A FlyBase konzorcium egy kurátorokból, fejlesztőkből és oktatókból álló csapat négy helyszínen: a Harvard Egyetemen, a Cambridge-i Egyetemen, az Indiana Egyetemen és az Új-Mexikói Egyetemen. A FlyBase a genetikai kutatások több mint egy évszázadát felölelő elsődleges tudományos szakirodalomból kurált adatokat tartalmaz. Az évek során a konzorcium új adatmegjelenítési formátumokat és új bioinformatikai eszközöket fejlesztett ki, hogy ezeket az adatokat biológiai felfedezések és transzlációs kutatások céljából bányásszák. Ezek az erőfeszítések a FlyBase-t egy egyszerű adatbázisból egy hatékony tudásbázissá alakították át.

A FlyBase oldal jelentős változásokon ment keresztül legutóbbi, két évvel ezelőtti áttekintésünk óta (1). 2017 februárjában kiadtuk a következő generációs weboldal béta verzióját, amelyet “FlyBase 2.0”-nak neveztünk el. A nyilvános visszajelzések és a csiszolás időszakát követően a FlyBase 2.0 2017 decemberében váltotta fel az előző honlapot. Ebben az áttekintésben megvitatjuk, miben más és jobb ez a következő generációs weboldal, és mire számíthat az új és továbbfejlesztett FlyBase 2.0 látogatásától most és a jövőben. Bár ebben az áttekintésben az új adatokra és eszközökre összpontosítunk, a FlyBase 2.0 felhasználói felületén (UI) is történt néhány fontos változás. Az érdeklődő olvasót a FlyBase egyéb aspektusait részletesen tárgyaló korábbi, 2017-es NAR-áttekintésre utaljuk (1).

QuickSearch ÉS HITLISTS

A használati statisztikák szerint a legtöbb felhasználó a FlyBase-t a kezdőlapon található “QuickSearch”-en keresztül keresi le. 2017 augusztusában a FlyBase a “QuickSearch”-hez hozzáadta a “GAL4 stb.” fület. Ez a keresés arra a régóta fennálló igényre válaszolt, hogy a FlyBase-ben a GAL4 és más bináris meghajtók, valamint a lacZ és GFP riporterek különböző típusú expressziós mintákat használó, kezelhető módon lehessen keresni. A keresés allélokat, konstrukciókat, inszerciókat és elérhető állományokat ad vissza, és lehetőség van az eredmények társított csoportokban történő megjelenítésére (1. ábra). A BDSC-től származó készletrendelési információk és a publikációkban való hivatkozásuk száma alapján a legnépszerűbb GAL4 meghajtókat is megjelöli (2). A “GAL4 stb.” fül egy linket is tartalmaz, amely ezeknek a “gyakran használt” GAL4 meghajtóknak az átfogó listájához vezet.

1. ábra.

GAL4 keresési eredmény. A “GAL4 stb.” QuickSearch lapon végzett keresés eredménytáblázata, az “integrált táblázat” kimeneti opció kiválasztásával. A kereszthivatkozások a kapcsolódó allélok, konstrukciók, inszerciók és állományok csoportosítására szolgálnak. Két “gyakran használt” GAL4 meghajtó van megjelölve.

1. ábra.

GAL4 keresési eredmény. A “GAL4 stb.” QuickSearch lapon végzett keresés eredménytáblázata, az “integrált táblázat” kimeneti opció kiválasztásával. A kereszthivatkozások a kapcsolódó allélok, konstrukciók, inszerciók és állományok csoportosítására szolgálnak. Két “gyakran használt” GAL4 meghajtó van megjelölve.

Bár a QuickSearch több lapot is tartalmaz a specifikus keresésekhez, a legtöbben az általános ‘Search FlyBase’ lapot használják. Tekintettel ennek a belépési pontnak a fontosságára, erőfeszítéseink nagy részét arra fordítottuk, hogy a FlyBase 2.0 számára alapvetően megváltoztassuk és javítsuk az e keresés által visszaadott “találati listákat”, teljes mértékben kihasználva az új webhely-architektúra előnyeit (2. ábra). A találati lista találati oldalának felhasználói felületét érintő fejlesztések közé tartozik a kis képernyőkön (pl. okostelefonokon) való megjelenítéshez szükséges “reszponzív” elrendezés, a betöltési idő csökkentése érdekében a lapozás, valamint egy beágyazott új keresési űrlap.

2. ábra.

Keresési találati lista. A FlyBase keresés találati oldala a ‘Mad’ keresőkifejezéssel. Megjelenik egy “találati lista”, amely géneket, állományokat, allélokat és a FlyBase adatelemek számos más osztályát tartalmazza (néhány nem látható). A Mad génjelentés gombot egy kék zászló jelzi, ami az aktuális kiadás új annotációit jelzi; a zászló fölé egérrel mozgatva egy összefoglaló jelenik meg. A listát az adatosztály és faj szerinti szűrésre, oldalszámozásra, megtekintésre és elemzésre szolgáló eszközök sora keretezi.

2. ábra.

Keresési eredmények találati listája. A FlyBase keresés találati oldala a ‘Mad’ keresőkifejezéssel. Megjelenik egy “találati lista”, amely géneket, állományokat, allélokat és a FlyBase adatelemek számos más osztályát tartalmazza (néhány nem látható). A Mad génjelentés gombot egy kék zászló jelzi, ami az aktuális kiadás új annotációit jelzi; a zászló fölé egérrel mozgatva egy összefoglaló jelenik meg. A listát az adatosztály és faj szerinti szűrésre, oldalszámozásra, megtekintésre és elemzésre szolgáló eszközök sora keretezi.

Az új találati lista jelentős jellemzője, hogy “vegyes”, azaz a keresési kifejezésnek megfelelő FlyBase-adatok minden osztályát tartalmazza. Minden egyes egyező elem egy panelben található, amely a fontos információk tömör válogatását tartalmazza (2. ábra). A jobb szélén található színkódolt jelvények lehetővé teszik a tételek gyors, adatosztályonkénti beolvasását (2. ábra). Egy kék zászló jelzi, hogy a FlyBase legutóbbi kiadásában új adatokat csatoltak egy elemhez (2. ábra). A gombok FlyBase-jelentésekhez, genomböngészőkhöz vagy kapcsolódó elemek új találati listáihoz vezetnek, például egy adott génhez tartozó panel tartalmazza a kapcsolódó allélok, állományok, transzkriptek, polipeptidek és referenciák gombjait (2. ábra). Minden egyes adatosztály panel tartalmaz osztály-specifikus információkat is; például egy allél panel megjeleníti az allél létrehozásához használt mutagént, a kapcsolódó inszerciókat és az allélhez kapcsolódó fenotípus állítások számát.

A vegyes találati lista szűrhető faj vagy adatosztály szerint (2. ábra). A fajszűrő lehetővé teszi annak kiválasztását, hogy a legyekben lévő humán transzgének, valamint a nem-melanogaster vagy nem-Drosophila eredmények szerepeljenek/nem szerepeljenek. Az adatosztály-szűrők beállíthatók úgy, hogy egy szűkebb, néhány érdekes adatosztályból álló találati listát vagy egyetlen adatosztályt jelenítsenek meg. A keresési eredmények egyetlen adatosztályra való leszűkítése egyetlen osztály eszközeit és megjelenítési lehetőségeit nyitja meg. Vegye figyelembe, hogy a QuickSearch eszköz legtöbb lapja közvetlenül egy adatosztályra vonatkozó találati listákat hoz létre.

Ha a találati lista egyetlen adatosztályra van szűrve, elérhetővé válik a “táblázat” nézet opció. A Table nézet egy függőlegesen kompakt táblázatos megjelenítés, az adott osztálynak megfelelő sorolható oszlopokkal (3. ábra). Egy sor elemzési eszköz válik elérhetővé, ha a találati lista egyetlen adatosztályt tartalmaz. Ezek az eszközök a találati lista oldal tetején jelennek meg a “Konvertálás”, “Exportálás” és “Elemzés” feliratú gombsor formájában (3. ábra). A Convert gombot az adatosztályok közötti kiterjedt kereszthivatkozások működtetik, lehetővé téve például, hogy a gének listáját a kapcsolódó referenciák listájává, vagy az allélok listáját a kapcsolódó beillesztések listájává alakítsa. Az Export gomb az aktuális találati listát a FlyBase számos eszköze, például a Batch Download vagy a Feature Mapper bármelyikébe továbbítja. Ez a legjobb módja annak is, hogy a találati listát FlyBase azonosítók halmazaként töltse le. Az Analyze gomb többféle, a találati listát összefoglaló rövid jelentést generálhat, például az anatómiai kifejezések vagy fenotípusos osztályok gyakoriságát egy allél találati listához, vagy átirányíthatja a találati listát az Interactions Browser eszközbe. Ezekkel a fejlesztésekkel a találati lista a FlyBase keresési eredmények felülvizsgálatának, finomításának és elemzésének hatékony eszközévé vált.

3. ábra.

A keresési eredmények találati listájának táblázatos nézete. Az “Őrült” keresési eredményoldal, az Allél adatosztályra szűrve és táblázatos nézetre váltva. Az Exportálás eszköz menüje kibővült.

3. ábra

A keresési találati lista táblázatos nézete. Az ‘Őrült’ keresési találati oldal, az Allél adatosztályra szűrve és táblázatos nézetre váltva. Az Exportálás eszköz menüje kibővült.

BESZÁMOLÁSI JAVÍTÁSOK

A FlyBase jelentésekben több figyelemre méltó változás történt, amelyek javítják a használhatóságot és javítják az adatok megjelenítését. Például mostantól minden jelentés tartalmaz egy navigációs panelt az oldal jobb oldalán (4. ábra). Ez a panel a jelentés összes legfelső szintű szakaszára mutató linkeket tartalmaz, és segítségével gyorsan át lehet ugrani az érdeklődésre számot tartó szakaszokra. Az összes jelentés “Hivatkozások” szakasza továbbfejlesztésre került, hogy könnyebbé tegye a publikációs listák szűrését és rendezését (további információkért lásd az alábbi “Interaktív hivatkozások és grafikus összefoglalók” című részt).

4. ábra.

FlyBase Gene Report. FlyBase Gene Report a Cdk1 génre vonatkozóan. Az Általános információk rész a géninformációk “szuper-összefoglalójaként” szolgál. A jobb oldali ‘Report Sections’ (Jelentés szakaszai) menü lebeg, ahogy a felhasználó görget a jelentésben, így egyszerű navigációs eszközt biztosít. A Genomic Location szakasz külső linkeket tartalmaz az NCBI, Ensembl, UCSC és PopFly genom böngészőkhöz.

4. ábra.

FlyBase Gene Report. FlyBase Gene Report a Cdk1 génre vonatkozóan. Az Általános információk rész a gén információinak “szuper-összefoglalójaként” szolgál. A jobb oldali ‘Report Sections’ (Jelentés szakaszai) menü lebeg, ahogy a felhasználó görget a jelentésben, így egyszerű navigációs eszközt biztosít. A Genomic Location szakasz külső linkeket tartalmaz az NCBI, Ensembl, UCSC és PopFly genom böngészőkhöz.

A génekre vonatkozó összefoglaló funkcionális információk fontosak honlapunk felhasználói számára, különösen azok számára, akik transzlációs kutatásokban vesznek részt. Az elmúlt évek során a FlyBase génjelentések “Általános információk” felső szekciója “szuper-összefoglalóvá” fejlődött, amely sokféle gén áttekintő adatot tartalmaz (4. ábra). A FlyBase 2.0-ban ez magában foglalja a Gene Snapshot-ot, egy automatikusan generált összefoglalót, annak a géncsoportnak a leírását, amelyhez a gén tartozik (3), UniProt-funkciós adatokat, történelmi Red Book információkat (4) és az Interactive Fly (http://www.sdbonline.org/fly/aimain/1aahome.htm) összefoglalóját, amikor ezek rendelkezésre állnak. A Gene Snapshots kézzel írt összefoglalók, amelyeket az adott génben jártas kutatóktól kérnek, és gyors áttekintést nyújtanak arról, hogy mit tudunk az adott gén funkciójáról (1).

A FlyBase 2.0 Gene Reports másik hasznos összefoglalója a “GO summary ribbon” (5. ábra). Ezeket a szalagokat korábban a Mouse Genome Database-ben (MGD) (5) valósították meg, és grafikusan megjelenítik a Gene Ontology (GO) kifejezések legfelső szintű desztillációját (6). Ez a szalag az Ontológia hierarchikus struktúráját használja arra, hogy a GO-kurációt néhány tucat magas szintű kifejezésre sűrítse, amelyek aztán az annotációk számát jelző színintenzitású chipekkel jelennek meg. A konkrétabb kifejezések felugró ablakként jelennek meg, ha az egérrel az egyes cellákra mutatunk, vagy táblázatos formában megtekinthetők a jelentés Gene Ontology részében. A GO szalag jelentősen növeli a kutató azon képességét, hogy gyorsan felmérje, mit tudunk egy gén funkciójáról.

5. ábra

GO összefoglaló szalag. GO összefoglaló szalag a D. melanogaster Cdk1 génjéhez, ahogyan az egy FlyBase génjelentésbe van ágyazva.

5. ábra

GO összefoglaló szalag. GO összefoglaló szalag a D. melanogaster Cdk1 génjéhez, FlyBase Gene Reportba ágyazva.

A FlyBase 2.0 Gene Reports most már tartalmazza a két InterPro adatforrás, a Pfam és a SMART fehérjetartomány grafikáit, ahol rendelkezésre állnak (7,8). A Polipeptid jelentések az adott izoformára vonatkozó doméninformációkat, míg a Gén jelentések a leghosszabb izoformát jelenítik meg. Az egérrel felugró felugró ablakok és táblázatok részletesebb doménadatokat mutatnak, és linkeket biztosítanak az InterPro jelentésekhez. Ezek a megjelenítések kiegészítik a genom böngészőkben található sávokat, amelyek ugyanezeket az adatokat mutatják génmodellekhez igazítva (lásd alább).

PERIMENTÁLIS ESZKÖZÖK

A FlyBase egyik nélkülözhetetlen funkciója a kísérletek tervezéséhez szükséges információk forrása a légytörzsekről és a reagensekről. Ennek a funkciónak a fontosságára rávilágított a FlyBase 2012-es felmérése, amelyben a válaszadók ∼90%-a azt mondta, hogy vagy “nagyon hasznosnak” találja a FlyBase-t, vagy “nem tudná megcsinálni a FlyBase nélkül”. Ebből a célból létrehoztunk egy új “Kísérleti eszköz” adatosztályt. A jelentések a géntermék kimutatására (pl. FLAG tag, EGFP), szubcelluláris célzásra (pl. nukleáris lokalizációs jel, szignálszekvencia), bináris rendszerben történő expresszióra (pl. UAS, GAL4) vagy klonális/kondicionális expresszióra (pl. FLP, FRT) használt eszközöket írnak le. Minden egyes kísérleti eszközről szóló jelentés tartalmazza az eszköz leírását és felhasználását, valamint a kapcsolódó transzgenikus konstrukciók böngészhető táblázatait. Ezek a táblázatok felsorolják a konstrukciók összetevőit (pl. szabályozó régió, kódolt termék), a transzgenikus allélokat és a konstrukciókat, amelyek mindegyike állományokhoz kapcsolódik, így a kutatók könnyen azonosíthatják a hasznos légytörzseket. Az eszközök könnyebb megtalálása érdekében azok a vonatkozó allél- és konstrukciójelentéseken is megjelennek, és az interaktív találati listákhoz hozzáadtuk az új kísérleti eszköz adatosztályát. Ez az új kísérleti eszköz adatosztály tovább erősíti a FlyBase-t, mint a Drosophila-kutatás fontos forrását.

MULTI-SPECIES MINING AND TRANSLATIONAL RESEARCH

A FlyBase több éve ad otthont adatoknak és fejlesztett eszközöket a légygének több szervezetben található ortológjainak azonosítására. Ez magában foglalta az OrthoDB (https://www.orthodb.org/, PMID:27899580) (9) ortológiai adatait és a DIOPT (https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl) (10) meta-analízisét. A FlyBase-ben található OrthoDB ortológiahívásokat 2017-ben frissítették, és most már számos Drosophila-fajra, más rovarokra és számos más fajra is kiterjednek. Az ortológ génre mutató linkek mellett a Gene Reports most már az OrthoDB-csoportokra mutató linkeket is tartalmaz, ami lehetővé teszi a felhasználó számára, hogy akár 5000 faj ortológjait azonosítsa.

ADIOPT számos különböző ortológia-előrejelző algoritmus (köztük az OrthoDB) metaanalízise, amelyet nemrég, 2018-ban frissítettek az Arabidopsis thaliana és három új előrejelző algoritmus bevonásával. A FlyBase Gene Reportsban a Drosophila melanogaster és más modellorganizmus-fajok alapvető készlete közötti DIOPT és OrthoDB ortológiakihívásokat egy kompakt megjelenítésben aggregálják, hogy informatív összefoglalót készítsenek. Ez a rész linkeket is megjelenít a megjósolt ortológ fehérjéhez való igazodáshoz, és jelzi, hogy a humán ortológ a Drosophilába átültetve funkcionálisan kiegészíti-e a légymutánst.

FlyBase 2.0 Norbert Perrimon és Hugo Bellen csoportjaival együttműködve új online eszközöket fejlesztett ki, amelyek lehetővé teszik az ortológ génfunkciók (Gene2Function;http://gene2function.org) (11), a foszforilációs helyek és más fehérjék poszt-transzlációs módosításainak (https://www.flyrnai.org/tools/iproteindb/web/) konzerváltsága (bioRxiv https://doi.org/10.1101/310854), a szervezetek közötti génkölcsönhatások (MIST;) (12) és egy olyan keresőeszköz kifejlesztését, amely az ortológokról, a humán genetikáról és a betegségekről (MARRVEL;http://marrvel.org) (13) különféle információkat ad vissza. Ezek és más, külső forrásokra mutató hasznos linkek a FlyBase kezdőlapjának oldalsávjában ikonok formájában jelennek meg. Ez csak néhány példa arra, hogy a FlyBase hogyan folytatja a harmadik felekkel való együttműködést új eszközök kifejlesztése és a Drosophila közösség alapvető felfedezéseinek és transzlációs kutatásainak támogatása érdekében.

A FlyBase konzorcium az elmúlt néhány évben növelte részvételét a The Alliance of Genome Resources (The Alliance;https://alliancegenome.org) (14) szervezetben. A “Szövetség” egy olyan együttműködés, amelynek célja a különböző modellorganizmusok adatbemutatásának konszolidálása és homogenizálása, valamint integrálása az emberből származó adatokkal, a biológiai felfedezések és a transzlációs kutatások felgyorsítása érdekében. Az Alliance jelenleg hat modellorganizmus-adatbázis (Saccharomyces Genome Database, WormBase, FlyBase, Zebrafish Information Network, Mouse Genome Database, Rat Genome Database) és a Gene Ontology (GO) projekt együttműködését jelenti. A Szövetség tevékenységei az NIH Common Fund Big Data to Knowledge (https://commonfund.nih.gov/bd2k) programjának részét képezik, amelynek egyik fontos célja az “adatközösségek” (https://commonfund.nih.gov/commons) kialakítása. Ez a Data Commons lesz az NIH által finanszírozott kutatások által generált nagyméretű adatok tárolója, megfelelő API-kkal, amelyek biztosítják, hogy az adatok mindenki számára hozzáférhetőek legyenek, olyan formátumban, amely megtalálható, hozzáférhető, interoperábilis és újrafelhasználható (FAIR). Az elmúlt két évben a FlyBase nagy adathalmazokat bocsátott a Data Commons rendelkezésére, és API-kat fejlesztett ki a használatuk megkönnyítésére. A Data Commons kísérleti szakasza az NIH adattudományi stratégiai tervének részehttps://www.nih.gov/news-events/news-releases/nih-releases-strategic-plan-data-science, amelynek célja új módszerek kidolgozása az NIH-ból származó adathalmazok felhőkörnyezetben történő tárolására, megosztására és elemzésére. További információkért ezekről a programokról, a Szövetségről és a FlyBase szerepéről ezekben az olvasót egy nemrégiben megjelent átfogó áttekintéshez (14) ajánljuk.

Hivatkozások és grafikai összefoglalók

Majdnem minden FlyBase jelentésoldalon van egy “Hivatkozások” szakasz, amely tartalmazza az adott entitással (gén, allél, inszerció stb.) kapcsolatos publikációk listáját. Ez a rész a FlyBase 2.0-ban egy interaktív oldalsávval bővült, amely lehetővé teszi a felhasználó számára a publikáció típusa szerinti szűrést, pl. “kutatási tanulmány” vagy “áttekintés” (6. ábra). A felhasználók év vagy szerző szerint is rendezhetnek, kereshetnek szöveg szerint, és a szerkesztett publikációs listákat Batch Download, HitList vagy RIS idézetként exportálhatják kedvenc referenciakezelőjük számára. A génjelentés esetében az egyik növekvő kihívást az jelenti, hogy meg kell különböztetni azokat a cikkeket, amelyek egy génre összpontosítanak, azoktól, amelyek csak kisebb utalást tartalmaznak rá, például egy genom-szerte végzett elemzés egyik adatpontjaként. Annak érdekében, hogy segítsük a felhasználót az adott gén szempontjából leginkább releváns dolgozatok azonosításában, bevezettünk egy “reprezentatív publikáció” részt. Ez a kategória legfeljebb 25 olyan publikációt tartalmaz, amelyeket a FlyBase egy adott gén azonosítása és funkciója szempontjából a leginformatívabbnak ítélt. E reprezentatív publikációk azonosításához kifejlesztettünk egy algoritmust, amely az adott génre vonatkozó adatok mennyisége és jellege alapján rangsorolja a publikációkat relevancia szerint, különös tekintettel azokra a publikációkra, amelyek címükben vagy kivonatukban megemlítik a gént. Az a képesség, hogy a több száz, egy gént megemlítő cikk közül azonosítani tudjuk a leginformatívabbakat, a hivatkozási rész egyéb rendezési lehetőségeivel együtt elkezdi kezelni a gyorsan növekvő biológiai irodalommal való megküzdés problémáját.

6. ábra.

Interaktív hivatkozási rész. Hivatkozások rész a publikációtípusok szerinti szűrési lehetőségekkel (bal oldalsáv), beleértve a reprezentatív publikációkat, valamint a különböző rendezési, keresési és exportálási lehetőségeket.

6. ábra

Interaktív hivatkozások rész. Hivatkozások szakasz a publikációtípusok szerinti szűrési lehetőségekkel (bal oldalsáv), beleértve a reprezentatív publikációkat, valamint a különböző rendezési, keresési és exportálási lehetőségeket.

A FlyBase egy másik módja annak, hogy segítse a felhasználókat a releváns irodalom megtalálásában, a “grafikus összefoglalók” – a Cell Press által néhány évvel ezelőtt először bevezetett, a cikk eredményeit összefoglaló képek – beépítése. A FlyBase megállapodást kötött a Cell Press-szel a grafikus összefoglalók megjelenítésére a megfelelő referenciajelentésben. E grafikus összefoglalók miniatűrjei a hivatkozási találati lista elemeinek paneljein is megjelennek, ha rendelkezésre állnak. A grafikus absztraktra kattintva a felhasználó a Cell Pressnél található absztrakthoz és tanulmányhoz jut.

ÚJ GENOM BROWSER TRACKS ÉS MIGRÁCIÓ A GBrowse-ból a JBrowse-ba

A FlyBase GBrowse genom böngészője már évek óta megjeleníti az annotált génmodelleket és a genom és epigenom számos más feltérképezett jellemzőjét, amelyek mind külön “track”-ként jelennek meg (15) A FlyBase egyedi trackjei közé tartoznak a különböző projektekből származó RNS-Seq jelgrafikonjai a fejlődési idő alatt vagy környezeti ingerekre adott válaszként, valamint a fehérjetartományok, amelyek a D. melanogaster genom referencia törzséhez (1). A fehérjedoménekre vonatkozó információk egy új sávval bővültek, amely a SMART által előre jelzett doméneket mutatja, kiegészítve a korábban bevezetett “Pfam” sávot, és egy második független nézetet nyújtva arról, hogy egy gén mely fehérjedoméneket kódolja, és hogyan oszlanak meg az exonok között (7,8). A gén- és polipeptidjelentések e domének vázlatait is tartalmazzák (lásd a fenti jelentésfejlesztéseket).

Míg a GBrowse hosszú évekig a FlyBase genomböngésző platformja volt, a FlyBase 2.0-val megkezdtük a genomsávok áttelepítését a következő generációs genomböngészőre, a JBrowse-ra (16). A JBrowse számos olyan egyedi funkcióval rendelkezik, amelyek javítják a genom böngészés egyszerűségét és funkcionalitását, mint például a nagyobb sebesség és érzékenység, a konfigurálható pályák, az azonos képernyőn történő pályaválasztás és a kattintással és húzással történő navigáció. A FlyBase 2.0-ban a legtöbb genom böngésző linket tartalmazó oldal jelenleg lehetővé teszi a felhasználók számára, hogy válasszanak a GBrowse és a JBrowse között. Amint a JBrowse-ra való áttérésünk befejeződik, a GBrowse elavulttá válik, de egy évig még elérhető marad, és utána a JBrowse lesz az egyetlen, a FlyBase által üzemeltetett genomböngésző. A FlyBase genom böngészőin kívül a közelmúltban a Gene Report “other genome views” szakaszában linkeket adtunk az NCBI, Ensembl, UCSC és PopFly böngészőire, amelyek különböző annotációkkal és funkciókkal rendelkeznek (4. ábra). A PopFly böngésző például a D. melanogaster természetes populációiban azonosított DNS-polimorfizmusokat mutatja be. A FlyBase folyamatosan értékeli az új közösségi adatkészleteket a genomböngészőinkbe való felvételhez. A jelenlegi tervek között szerepel a fejlődési proteom annotációjának javítása és a Drsosophila RNAi Screening Center (DRSC) (https://fgr.hms.harvard.edu/) által előre jelzett hatékony gRNS célpontok helyeinek hozzáadása a CRISPR-technológiához (17).

ÚJ ESZKÖZÖK A HATALMAS HASZNÁLÓKNAK

A FlyBase 2.0 építése jelentős változtatással járt a backend architektúrában, ami új képességeket tett lehetővé a “hatalom felhasználói” számára. Javítottuk a felhőkompatibilitást, hozzáadtunk egy alkalmazásprogramozási felületet (API) (https://flybase.github.io/), és alapvetően átszerveztük a kódot, hogy modulárisabb szerkezetű legyen. Továbbra is támogatjuk a nyilvánosan elérhető Chado adatbázist (https://flybase.github.io/) és az XML, FASTA, GFF, GTF és egyéb tömeges adatfájlok letöltését az FTP-oldalunkon (ftp://ftp.flybase.org/) keresztül.

KÖZÖSSÉGÜGYI KAPCSOLATOK

A FlyBase nagyban profitál a jól működő felhasználói közösségből. 2014 óta a FlyBase Community Advisory Group (FCAG), egy világszerte több mint 500 kutatóból álló, a FlyBase fejlesztése iránt elkötelezett csoport, rendszeres felmérésekre válaszolva felbecsülhetetlen értékű információkat szolgáltat arról, hogy a kutatók ténylegesen hogyan használják a FlyBase-t, és javaslatokat tesz az új képességekre. Ezek a visszajelzések folyamatosan alakítják azt, hogy a FlyBase hogyan alkalmazkodik az új adatokhoz és felhasználói igényekhez. Célunk, hogy minden Drosophila-laborból legyen egy képviselő az FCAG-ben; az új képviselők a FlyBase Közösségi Tanácsadó Csoportja linkre kattintva regisztrálhatnak a FlyBase Közösség menüpontjában (http://flybase.org/wiki/FlyBase:Community_Advisory_Group). Egy másik folyamatos erőfeszítésünk a videós oktatóvideók készítése, amely az elmúlt két évben felgyorsult: nyolc új videót tettünk közzé a YouTube csatornánkon (https://www.youtube.com/c/FlyBaseTV), amelyek különböző keresési technikákat, a FlyBase 2.0 weboldal új funkcióit és a JBrowse-t tárgyalják. Az új honlapon a FlyBase Twitter feed (https://twitter.com/FlyBaseDotOrg) is megjelenik a honlap bal oldalsávjában, amelyet arra használunk, hogy figyelmeztessük a felhasználókat az új adatokról és funkciókról, valamint a légyközösséget érintő aktuális hírekről.

Nézünk a jövőbe

A jövő kihívása az lesz, hogy lépést tartsunk a biológiai információ gyorsuló növekedésével, beleértve az új nagy áteresztőképességű módszerekből származó egyre növekvő mennyiségű nagy adatot. Ezek közé az új módszerek közé tartozik az egysejtes RNS-szekvenálás (RNA-Seq), amely a génexpresszióról finom időbeli és térbeli információkat szolgáltat. Ahhoz, hogy e módszerben rejlő lehetőségeket teljes mértékben ki lehessen aknázni, elengedhetetlen lesz új megközelítéseket kidolgozni a nagy mennyiségű adat integrálására és interaktív formában történő megjelenítésére, amely egyszerre hasznos és egyszerű. A FlyBase folytatja a fejlődési proteom adatok integrálását, amint azok elérhetővé válnak, és grafikus megjelenítések és a JBrowse segítségével integrálja azokat az RNA-Seq adatokkal, hogy a funkcionális genomika hatékony eszköze legyen. A géntermékek közötti útvonalak és kölcsönhatások új interaktív kijelzőinek jövőbeli fejlesztése tovább fogja erősíteni a sejthálózatok megértésének rendszerszemléletű megközelítését. Elképzeléseink szerint más, alapvetően új adatosztályok integrálására is sor kerülhet. Ezek közé tartoznak a Drosophila metabolikus útvonalai és a mikrobiom, a légyben és a légyre telepített mikroorganizmusok populációja. Tekintettel arra, hogy a FlyBase és más MOD-ok felépítése génközpontú volt, ezen adatok integrálása új kihívásokat fog jelenteni, és harmadik féllel való együttműködést és összekapcsolást igényel. Természetesen a növekvő biológiai információval kapcsolatos összes ilyen kihívásnak való megfelelés a megfelelő erőforrások rendelkezésre állásától függ.

A FlyBase továbbra is aktív tagja lesz az Alliance of Genome Resources-nak (The Alliance; https://alliancegenome.org) (14). Ez magában foglalja az adatok homogenizálására, valamint az alapozó és transzlációs kutatásokhoz szükséges új kijelzők és eszközök kifejlesztésére irányuló erőfeszítéseket. Ezeknek az erőfeszítéseknek része lesz olyan új API-k létrehozása, amelyek lehetővé teszik a teljesítményfelhasználók számára az NIH Data Commonsban letétbe helyezett nagy adathalmazok lekérdezését és az azokkal való munkát. Ezek fontos jövőbeli erőfeszítések lesznek, mivel a nagy adathalmazok áradata és a bioinformatika jelentősége az orvosbiológiai kutatásban tovább növekszik.

A FlyBase az elmúlt 27 év során egyszerű adatbázisból nagy teljesítményű tudásbázissá fejlődött. A FlyBase a légyadatok gondozásában és terjesztésében betöltött alapvető szerepe mellett folyamatosan új eszközöket fejleszt a génfunkciók felfedezéséhez a különböző organizmusokban és az emberi betegségekkel való kapcsolatukhoz (18). A FlyBase továbbra is alapvető fontosságú a légykutató közösségre jellemző számos adattípus támogatásában, hogy a Drosophila teljes potenciálját ki lehessen aknázni a biológiai felfedezések és a transzlációs kutatások terén (19). A FlyBase 2.0 tudásbázisra való további építkezés még inkább képessé teszi a Drosophila közösséget új ötletek felfedezésére, az élet új aspektusainak felkutatására, és arra, hogy bátran menjen oda, ahová eddig még senki sem ment.

FELHÍVÁSOK

Köszönetet szeretnénk mondani a FlyBase többi PI-jének, kurátorának és fejlesztőjének a kézirathoz fűzött megjegyzéseikért. Külön köszönet Julie Agapite-nak és Victoria Jenkinsnek kiterjedt szerkesztői hozzájárulásukért. A cikk megírásának időpontjában a FlyBase konzorcium tagjai a következők voltak: Norbert Perrimon, Susan Russo Gelbart, Julie Agapite, Kris Broll, Lynn Crosby, Gilberto dos Santos, David Emmert, L. Sian Gramates, Kathleen Falls, Victoria Jenkins, Beverley Matthews, Carol Sutherland, Christopher Tabone, Pinglei Zhou, Mark Zytkovicz, Nick Brown, Giulia Antonazzo, Helen Attrill, Phani Garapati, Alex Holmes, Aoife Larkin, Steven Marygold, Gillian Millburn, Clare Pilgrim, Vitor Trovisco, Pepe Urbano, Thomas Kaufman, Brian Calvi, Bryon Czoch, Josh Goodman, Victor Strelets, Jim Thurmond, Richard Cripps, Phillip Baker.

FUNDING

A FlyBase-t az NIH, NHGRI ; UK Medical Research Council finanszírozza. A nyílt hozzáférés díjának finanszírozása: NIH, NHGRI .

Megállapítás az összeférhetetlenségről. Nincs bejelentett.

Gramates
L.S.

,

Marygold
S.J.

,

Santos
G.D.

,

Urbano
J.M.

,

Antonazzo
G.

,

Matthews
B.B.

,

Rey
A.J.

,

Tabone
C.J.

,

Crosby
M.A.

,

Emmert
D.B.

et al.

FlyBase at 25: looking to the future

.

Nucleic Acids Res.
2017

;

45

:

D663

D671

.

Cook
K.R.

,

Parks
A.L.

,

Jacobus
L.M.

,

Kaufman
T.C.

,

Matthews
K.A.
New research resources at the bloomington drosophila stock center

.

Légy

.

2010

;

4

:

88

91

.

Attrill
H.

,

Falls
K.

,

Goodman
J.L.

,

Millburn
G.H.

,

Antonazzo
G.

,

Rey
A.J.

,

S.J.
Marygold.
FlyBase Consortium
FlyBase: establishing a Gene Group resource for Drosophila melanogaster

.

Nucleic Acids Res.
2016

;

44

:

D786

D792

.

Lindsley
D.L.

,

Zimm
G.G.
The Genome of Drosophila Melanogaster

.

1992

;

San Diego

:

Academic Press

.

Smith
C.L.

,

Blake
J.A.

,

Kadin
J.A.

,

Richardson
J.E.

,

Bult
C.J.
Mouse Genome Database, G.
Mouse Genome Database (MGD)-2018: knowledgebase for the laboratory mouse

.

Nucleic Acids Res.
2018

;

46

:

D836

D842

.

The Gene Ontology Consortium
Expansion of the gene ontology knowledgebase and resources

.

Nucleic Acids Res.
2017

;

45

:

D331

D338

.

Finn
R.D.

,

Coggill
P.

,

Eberhardt
R.Y.

,

Eddy
S.R.

,

Mistry
J.

,

Mitchell
A.L.

,

Potter
S.C.

,

Punta
M.

,

Qureshi
M.

,

Sangrador-Vegas
A.

et al.

The Pfam protein families database: towards a more sustainable future

.

Nucleic Acids Res.
2016

;

44

:

D279

D285

.

Letunic
I.

,

Bork
P.
20 years of the SMART protein domain annotation resource

.

Nucleic Acids Res.
2018

;

46

:

D493

D496

.

Zdobnov
E.M.

,

Tegenfeldt
F.

,

Kuznetsov
D.

,

Waterhouse
R.M.

,

Simao
F.A.

,

Ioannidis
P.

,

Seppey
M.

,

Loetscher
A.

,

Kriventseva
E.V.
OrthoDB v9.1: állati, gombás, növényi, archeális, bakteriális és vírusos ortológok evolúciós és funkcionális annotációinak katalogizálása

.

Nucleic Acids Res.
2017

;

45

:

D744

D749

.

Hu
Y.

,

Flockhart
I.

,

Vinayagam
A.

,

Bergwitz
C.

,

Berger
B.

,

Perrimon
N.

,

Mohr
S.E.
An integrative approach to ortholog prediction for disease-focused and other functional studies

.

BMC Bioinformatics

.

2011

;

12

:

357

.

Hu
Y.

,

Comjean
A.

,

Mohr
S.E.

,

FlyBase
C.

,

Perrimon
N.
Gene2Function: Egy integrált online erőforrás a génfunkciók felfedezéséhez

.

2017

;

7

:

2855

2858

.

Hu
Y.

,

Vinayagam
A.

,

Nand
A.

,

Comjean
A.

,

Chung
V.

,

Hao
T.

,

Mohr
S.E.

,

Perrimon
N.
Molecular Interaction Search Tool (MIST): an integrated resource for mining gene and protein interaction data

.

Nucleic Acids Res.
2018

;

46

:

D567

D574

.

Wang
J.

,

Al-Ouran
R.

,

Hu
Y.

,

Kim
S.Y.

,

Wan
Y.W.

,

Wangler
M.F.

,

Yamamoto
S.

,

Chao
H.T.

,

Comjean
A.

,

Mohr
S.E.

és mások

MARRVEL: Humán és modellorganizmusok genetikai erőforrásainak integrációja a humán genom funkcionális annotációjának megkönnyítése érdekében

.

Am. J. Hum. Genet.
2017

;

100

:

843

853

.

Howe
D.G.

,

Blake
J.A.

,

Bradford
Y.M.

,

Bult
C.J.

,

Calvi
B.R.

,

Engel
S.R.

,

Kadin
J.A.

,

Kaufman
T.C.

,

Kishore
R.

,

Laulederkind
S.J.F.

et al.

Model organism data evolving in support of translational medicine

.

Lab. Anim. (NY)

.

2018

;

47

:

277

289

.

Stein
L.D.
Using GBrowse 2.0 to visualize and share next-generation sequence data

.

Brief. Bioinform.
2013

;

14

:

162

171

.

Buels
R.

,

Yao
E.

,

Diesh
C.M.

,

Hayes
R.D.

,

Munoz-Torres
M.

,

Helt
G.

,

Goodstein
D.M.

,

Elsik
C.G.

,

Lewis
S.E.

,

Stein
L.

et al.

JBrowse: a dynamic web platform for genome visualization and analysis

.

Genome Biol.
2016

;

17

:

66

.

Mohr
S.E.

,

Hu
Y.

,

Ewen-Campen

B.

,

Housden
B.E.

,

Viswanatha
R.

,

Perrimon
N.
CRISPR guide RNA design for research applications

.

FEBS J.
2016

;

283

:

3232

3238

.

Wangler
M.F.

,

Yamamoto
S.

,

Bellen
H.J.
Fruit flies in biomedical research

.

Genetics

.

2015

;

199

:

639

653

.

Bilder
D.

,

Irvine
K.D.
Taking stock of the Drosophila research ecosystem

.

Genetics

.

2017

;

206

:

1227

1236

.

A szerzői megjegyzések

A FlyBase konzorcium tagjai a köszönetnyilvánításban szerepelnek.

© The Author(s) 2018. Published by Oxford University Press on behalf of Nucleic Acids Research.
Ez egy nyílt hozzáférésű cikk, amelyet a Creative Commons Attribution License (http://creativecommons.org/licenses/by/4.0/) feltételei szerint terjesztenek, amely engedélyezi a korlátlan újrafelhasználást, terjesztést és sokszorosítást bármilyen médiumban, feltéve, hogy az eredeti művet megfelelően idézik.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.