Genomic introgression through interspecific hybridization counteracts genetic bottleneck during soybean domestication

Genome-wide identification of putative G. soja-G. maxin introgression tunnistaminen

Voidaksemme tutkia genominlaajuista introgressiota viljeltyjen ja luonnonvaraisten soijapapujen välillä analysoimme koko genomin uudelleensekvensointitietoja edustavasta soijapapupopulaatiosta, joka käsittää 62 G. soja -lajiketta, 130 maatiaislajiketta ja 110 parannettua soijapapulajiketta, jotka on kerätty erilaisilta eko-maantieteellisiltä alueilta Kiinasta ja muista maista, mukaan luettuina Koreasta, Japanista, Venäjältä, Yhdysvalloista ja Kanadasta . Nämä näytteet jakautuivat lähes kaikkiin tärkeimpiin fylogeneettisiin kluadeihin/ryhmiin 18 480 kesytetyn soijapavun ja 1168 luonnonvaraisen soijapavun liittymästä, jotka on kerätty 84 maasta tai kehitetty Yhdysvalloissa ja jotka on talletettu Yhdysvaltain maatalousministeriön (USDA) soijapavun itäisyyskokoelmaan (USDA Soybean Germplasm Collection), minkä vuoksi niiden katsotaan edustavan hyvin soijapavun geneettistä monimuotoisuutta. Määritimme ensin jokaisesta 62 G. soja- ja 240 G. max -liitoksesta paikalliset alueelliset haplotyypit, jotka olivat identtisiä G. soja- ja G. max -alapopulaatioihin kuuluvien yksilöiden kanssa, käyttäen kaikkia 302 liitoksen SNP-tietoja aiemmin kuvatun lähestymistavan mukaisesti. Yhteisten haplotyyppien frekvenssien laskemiseksi soijagenomin kunkin kromosomin eri alueilla jaoimme kunkin kromosomin 10 kb:n suuruisiin lokeroihin ja laskimme kunkin liittymän ja kahden G. soja- ja G. max -alipopulaation välillä kirjattujen IBD-jaksojen lukumäärät lokeroa kohti pareittain vertailemalla. Nämä luvut normalisoitiin 0:sta (ei havaittu IBD:tä) 1:een (IBD:tä, joka on yhteinen kaikille yksilöille osapopulaatiossa), ja kunkin liittymän ja G. soja – osapopulaation välistä normalisoitua IBD:tä (nIBDG. soja) sekä kunkin liittymän ja G. max – osapopulaation välistä IBD:tä (nIBDG. max) käytettiin vertailtujen ryhmien välisen suhteellisen IBD:n (rIBD) laskemiseen (rIBD = nIBDG. soja – nIBDG. max). Lopuksi tunnistettiin oletettu genominen introgressio G. soja -alipopulaatiosta kuhunkin viljeltyyn soijapapuversioon ja G. max -alipopulaatiosta kuhunkin luonnonvaraiseen soijapapuversioon.

Tämän lähestymistavan avulla 302:sta versiosta 297:ssä havaittiin olevan oletettua lajienvälistä introgressiota (Lisätiedosto 1: Taulukko S1, Lisätiedosto 2: Kuva S1). 110 eliittilajiketta jätettiin pois jatkoanalyyseistä, koska näissä lajikkeissa esiintyi suhteellisen vähän introgressiota luonnonvaraisesta soijapavusta (0,00015~0,03) ja koska näiden lajikkeiden kehittämiseen liittyi ihmisen aikaansaamaa hybridisaatiota, joka saattoi peittää alleen luonnollisesti esiintyvät introgressiotapahtumat. Yksi maatiaisrotu jätettiin myös jatkoanalyysien ulkopuolelle, koska sen genomisekvenssien laatu oli suhteellisen heikko ja heterotsygotian taso korkea. Jäljelle jääneissä lajikkeissa, joihin kuului 62 G. soja -lajikkeen lajiketta ja 129 maatiaislajiketta, havaittujen introgressiivisten fragmenttien osuudet yksittäisissä genomeissa vaihtelivat 0,00037:stä 0,60:een, ja niiden keskiarvo oli 0,032 (kuva 1, lisätiedosto 1: taulukko S1). Havaitun introgression kromosomijakauma lajikkeissa, joiden yksittäisissä genomeissa on > 0,05 (5 %) introgressiivisia fragmentteja (lisätiedosto 1: taulukko S1), on esitetty kuvassa 2. G. soja -genomeissa havaittujen G. max -fragmenttien osuudet vaihtelevat 0,00059:stä 0,41:een, keskiarvon ollessa 0,019 (lisätiedosto 2: kuva S1, yläpaneeli). G. max -genomeista havaittujen G. soja -fragmenttien osuudet vaihtelevat 0,00037:stä 0,60:een, keskimäärin 0,031:een (Additional file 2: Kuva S1, alempi paneeli). Kaiken kaikkiaan 43,94 prosenttia ja 54,61 prosenttia G. soja- ja G. max -alapopulaatioiden oletetuista introgressiivisista fragmenteista on yhteisiä kahdelle tai useammalle liittymälle, ja loput ovat liittymäkohtaisia (lisätiedosto 2: kuva S2). Yksikään tässä tutkimuksessa havaituista oletetuista introgressiivisista fragmenteista ei ollut täysin kiinnittynyt G. soja- tai G. max -alapopulaatioissa (Kuva 2).

Kuva 1
kuvio1

Phylogeneettinen naapuriyhdistelmäpuu luonnonvaraisten ja viljeltyjen soijapapujen paneelista. Puu muodostettiin genomin uudelleen sekvensoinnilla havaittujen genomin laajuisten SNP:iden perusteella MEGA-ohjelmalla. Punaisella ja sinisellä merkityt oksat kuvaavat G. sojaa ja G. maxia (maatiaislajike). Yksittäisten liittymien koodit ja introgressoitujen fragmenttien osuus on esitetty puun ulommissa kerroksissa

Kuvio 2
kuvio2

Genominlaajuinen jakauma lajienvälisestä introgressiosta ja genomin ominaisuuksista. Ympyrän renkaat ulkoa sisälle osoittavat kromosomeja, mukaan lukien (i) kromosomivarret (harmaa väri) ja perisentromeeriset alueet (vihreä väri), (ii) introgressionopeuksien kromosomaalinen jakauma koko populaatiossa, (iii) domestikaatioon liittyvien QTL:ien kromosomaalinen jakauma, joka on merkitty punaisilla palkeilla vastaavassa renkaassa, (iv) valikoivien pyyhkäisykertojen kromosomaalinen jakauma, joka on merkitty punaisilla palkeilla vastaavassa renkaassa, ja (v) kromosomaalinen jakauma eri lajien välisestä introduktiosta kullakin kahdestatoista G-lajista. max- ja 10 G. soja -liitoksen välillä, kuten 22 renkaalla osoitetaan, joiden kunkin genomissa on yli 5 % introgressiivisia fragmentteja. Näissä 22 renkaassa G. max -segmentit on esitetty sinisellä ja G. soja -segmentit oranssilla

Soijapavun populaatiorakenteen ja sekoittumisen aiemmissa analyyseissä on havaittu paikallisia genomialueita, joilla on poikkeuksellisia yhtäläisyyksiä G. sojan ja G. max:n välillä (5, 7), ja näitä alueita on pidetty todisteina genomisesta introgressiosta. Edellä kuvattu rIBD-analyysi, jossa määritetään oletettuun introgressioon osallistuneiden yksittäisten lajikkeiden paikalliset genomialueet, tarjoaa lisätodisteita G. soja-G. max -integrogression tueksi. On kuitenkin mahdollista, että osa oletetusta introgressiosta, erityisesti G. max -taustassa havaitut oletetut G. soja -fragmentit, voivat johtua kotieläinjalostuksessa käytetyn lähdepopulaation esivanhempien polymorfismien epätäydellisestä linjalajittelusta. Pyrkiessämme keräämään lisätodisteita introgressiohypoteesin tueksi teimme D-statistiikka-analyysin suurille oletetuille G. max -introdusoituneille alueille, joita havaittiin kahdeksassa G. soja -liitoksessa (kuva 2) ja joita verrattiin pareittain kymmeneen satunnaisesti valittuun G. soja -liitokseen. max-liitoksille, joissa ei havaittu introgressiota (kuva 1), ja 14 G. max-liitoksessa havaituille suurille oletetuille G. soja -introgressioalueille (kuva 2), joita verrattiin pareittain 10 satunnaisesti valitun G. soja -liitoksen kanssa, joissa ei havaittu introgressiota (kuva 1). Kuten kuvasta 3a käy ilmi, oletettua introgressiota sisältävien alueiden D-statistiikka (D = – 0,15 ± 0,07) oli huomattavasti alhaisempi kuin alueilla, joilla ei ollut oletettua introgressiota (D = – 0,08 ± 0,05), ja se oli myös huomattavasti alhaisempi kuin genominlaajuinen keskiarvo (D = – 0,11 ± 0,04), mikä viittaa siihen, että geenivirta G. soja- ja G. max -taksonien välillä oli osallisena näillä genomialueilla, joilla oli havaittu oletettua introgressiota.

Kuvio 3
kuvio3

D-statistinen analyysi paljastaa erilaiset geenivirran mallit eri alueilla G. sojan ja G. maxin välillä. a D-statistiikka suurille putatiivisille G. max-introdusoituneet alueet, jotka on havaittu 8 G. soja -liitoksessa / suuret oletetut G. soja-introdusoituneet alueet, jotka on havaittu 14 G. max -liitoksessa, kun niitä verrataan pareittain näihin alueisiin satunnaisesti valituissa 10 G. max -liitoksessa. max -liitännäiset/10 G. max -liitännäiset, joissa ei ole havaittu lajien välistä introgressiota, verrattuna alueisiin, joissa ei ole todettu oletettua introgressiota. b D-tilasto perisentromeerisille alueille verrattuna kromosomihaaroihin liitännäisten välisessä parittaisessa vertailussa, kuten on kuvattu kohdassa a. Merkitsevät erot (p-arvot < 0.05) vertailtujen alueiden välillä, jotka on merkitty eri kirjaimilla boxbloteissa, havaittiin Kolmogorov-Smirnovin testillä

Yritimme jäljittää havaitun introgression alkuperää vertailemalla suuria ja edustavia introgressiosegmenttejä G. soja-lajikkeen (PI 578357, s61) ja maatiaisrodun (PI 339734, m30) introgressiosegmenttejä, joiden arvioitiin sisältävän 33 % ja 31 % introgressiosegmenttejä, vastaaviin alueisiin muissa lajikkeissa. Genomin laajuinen oletettu introgressio G. soja -liitoksessa PI 578357 (s61), joka on yksi G. soja -liitoksista G. max -kladeihin rajoittuvassa G. soja -liitoksessa, on esitetty esimerkkinä kuvassa 4b ja Additional file 2: Kuva S3.

Kuva 4
kuvio4

Esimerkki introgressiosta ja introgression oletetut alkuperät havainnollistettu suhteellisella identtisyydellä polveutumisen mukaan (rIBD). a-c Genomikomponentti kromosomia 2 pitkin kolmessa toisiinsa liittyvässä liitännäisliitännäisliitännäisessä: Heihexiaohuangdou, PI 578357, PI 578357 ja PI 522226. G. soja -liittymässä (b) on G. maxin introgressiosegmenttejä, joilla on suurin samankaltaisuus maatiaisrodun (a) vastaavien alueiden kanssa, ja G. soja -segmenttejä, joilla on suurin samankaltaisuus G. soja -liittymän vastaavien alueiden kanssa (c). d Kromosomin 2 introgressioalueiden SNP:hen perustuva kladogrammipuu, josta käy ilmi G. max -alkuperä (Heihexiaohuuhuangdou, sinisellä värillisellä värillisellä värillisellä värillisellä värillisellä värillisellä värillisellä värillisellä värillisellä värillisellä värillisellä värillisellä värillisellä värillisellä värillisellä värillisellä värillisellä värillisellä värillisellä värillisellä). soja -liitoksen PI 578357 alueiden alkuperä G. soja (PI 522226, punainen), kuten nuoli osoittaa. e Muiden kuin introgressioalueiden SNP:hen perustuva kladogrammipuu, joka osoittaa PI 578357 -liitoksen alueiden alkuperän G. soja (PI 522226, punainen), kuten nuoli osoittaa. f Kolmen sukulaisliitoksen maantieteellinen jakauma. g-i Genomikomponentti kromosomia 19 pitkin kolmessa sukulaisliitoksessa PI 548456, PI 339734 ja PI 407275. G. max -liittymässä (h) on introgressoituja G. soja -fragmentteja, jotka muistuttavat eniten G. soja -liittymän (i) vastaavia alueita, ja G. max -segmenttejä, jotka muistuttavat eniten G. max -liittymän (g) vastaavia alueita. j Muiden kuin introgressioalueiden SNP:iin perustuva kladogrammipuu, jossa näkyy nuolella osoitettujen PI 339734 -alueiden alkuperä G. max (PI 548456, sininen). k Kromosomin 2 introgressioalueiden SNP:iin perustuva kladogrammipuu, jossa näkyy G. soja G. soja (PI 407275, punainen) G. max -liitoksen PI 339734 alueiden alkuperää, kuten nuoli osoittaa. l Kolmen sukulaisliitoksen maantieteellinen jakauma

Introgressioalueet liitoksessa PI 578357 kattavat koko kromosomin 2 perisentromeerisen alueen, jolla ei ole aiemmin havaittuja kesyttämisen QTL:iä (kuva 2), ja näin ollen niiden katsottiin kokeneen minimaalisen valintapaineen niiden säilyttämisen vuoksi. Havaitsimme, että Venäjän Amurissa kasvatetun PI 578357:n kromosomin 2 tutkituilla alueilla on suurin sekvenssisekvenssin samankaltaisuus Kiinan Heiheessä kasvatetun maatiaisrodun Heihexiaohuangdou (m104) vastaavien alueiden kanssa (kuvat 4a, b, d, f). Sitä vastoin PI 578357:n ei-introgressioalueilla on suurin samankaltaisuus vastaavien alueiden kanssa G. soja -liitoksessa PI 522226 (s5), joka on viljelty Primorjessa, Venäjällä (kuvat 4b, c, e, f), joka on yksi niistä G. soja -liitoksista, jotka eroavat eniten PI 578357:stä ja G. max -linjasta (kuva 1), ja joka näin ollen tuskin osallistuu soijapavun kotieläinmuodostukseen käytettyyn lähdepopulaatioon tai on peräisin siitä. Koreassa viljellyn maatiaislajikkeen PI 339734 kromosomin 19 introgressioalueilla havaittiin olevan suurin samankaltaisuus vastaavien alueiden kanssa G. soja -lajikkeen PI 407275 (s42), jota on myös viljelty Koreassa, vastaavien alueiden kanssa (kuvat 4h, i, k, l). Sitä vastoin PI 339734:n ei-introgressioalueilla on suurin samankaltaisuus vastaavien alueiden kanssa maatiaisrodussa PI 548456 (m111), jota myös kasvatettiin Pjongjangissa, Pohjois-Koreassa (kuvat 4g, h, j, l). Paikallisten genomialueiden maantieteellinen levinneisyys, sekvenssien samankaltaisuuden ja eroavuuden mallit ja tasot sekä näiden kantojen koko genomin laajuinen sekvenssidiversiteetti ja fylogeneesi viittaavat yhdessä siihen, että edellä kuvattu kromosomien havaittu kimeerismi johtui todennäköisesti lajien välisestä introgressiosta eikä esi-isien polymorfismien epätäydellisestä polymorfian sukupuolittaisesta lajittelusta soijapavun kotieläinlajin kotieläinmuodostuksen lähdepopulaatiossa. Koko genomin geenisekvenssien perusteella PI 578357:n ja Heihexiaohuangdoun sekä PI 339734:n ja PI 407275:n väliset eroajat ajoitettiin vastaavasti ~ 0,37 ja 0,27 miljoonaa vuotta sitten (mya). Koska soijapavun kesyttäminen tapahtui vasta ~ 6000-9000 vuotta sitten, edellä esitettyjen kahden (G. soja-G. max)-annosparin tutkittujen introgressioalueiden näin suurta samankaltaisuutta olisi pidettävä suorana todisteena G. soja-G. max -introduktiosta.

Tekijät, jotka muokkaavat G. soja-G. max -annospapujen introduktiomaisemaa . max introgression

Ymmärtääksemme genomisen introgression jakautumista kahdessa osapopulaatiossa muokkaavia evolutiivisia voimia vertasimme ensin introgressoitujen fragmenttien keskimääräisiä osuuksia perisentromeeristen alueiden ja kromosomihaarojen välillä, jotka määriteltiin karkeasti paikallisen geneettisen rekombinaation nopeuden ja soijapavun genomissa olevien sentromeeririkkaiden toistojen fyysisen sijainnin perusteella. Yleisesti ottaen perisentromeerisilla alueilla geneettinen rekombinaatio on huomattavasti vähäisempää ja haitallisten mutaatioiden, kuten transponoituvien elementtien insertion, kasautuminen on vinoutunutta verrattuna kromosomivarsiin . Havaitsimme, että joistakin poikkeuksista huolimatta perisentromeerisilla alueilla on yleisesti ottaen suurempi osuus introgressoituneita fragmentteja joko G. soja -alipopulaatiossa tai G. max -alipopulaatiossa (parittainen Studentin t-testi, p-arvo < 0,01, kuva 2 ja lisätiedosto 3: taulukko S2). Perisentromeeristen alueiden D-statistinen analyysi verrattuna varsiin suoritettiin käyttäen samaa G. max- ja G. soja -liitosten osajoukkoa. Kuten kuvasta 3b käy ilmi, perisentromeeristen alueiden D-statistiikka (D = – 0,12 ± 0,06) oli huomattavasti alhaisempi kuin kromosomivarsien (D = – 0,09 ± 0,02) (kuva 3b), mikä viittaa geenivirran vinoutuneeseen kasautumiseen perisentromeerisille alueille. Tällainen vääristymä voi olla osittain seurausta geneettisen rekombinaation vähäisemmästä määrästä ja siten vähäisemmästä tehokkuudesta puhdistaa introgressoitunutta variaatiota/fragmentteja perisentromeerisilla alueilla verrattuna kromosomivarsiin.

Teoreettisesti genominen introgressio oli seurausta spontaanista hybridisaatiosta ja sitä seuranneesta takaisinristeytyksestä, johon osallistui G. sojan ja G. maxin väliseen risteytykseen olisi pitänyt kohdistua kaksi erilaista valintapainetta: luonnonvaraisten ominaisuuksien luonnonmukainen valinta luonnollisiin ympäristöihin sopeutuvien G. sojan tai G. sojan kaltaisten lajikkeiden muodostamiseksi ja viljeltyjen ominaisuuksien keinotekoinen valinta viljelyyn soveltuvien G. maxin tai G. maxin kaltaisten lajikkeiden kehittämiseksi. Jos näin on, voisimme olettaa, että introgressoitujen fragmenttien jakautumisessa olisi havaittavissa erilaisia malleja G. soja ja G. max -alipopulaatioiden välillä. Tämän hypoteesin testaamiseksi arvioimme ensin niiden 122 valikoivassa pyyhkäisyssä (kuva 2) esiintyneiden introgressiivisten fragmenttien osuudet, joissa nukleotidivaihtelu väheni voimakkaasti G. soja -alipopulaatiosta G. max -alipopulaatioon. Nämä alueet viljellyissä soijapavuissa olivat todennäköisesti seurausta voimakkaasta valikoivasta paineesta, joka kohdistui tiettyihin soijapavun kesyttämiseen liittyviin lokuksiin . Odotetusti G. max -fragmenttien osuus valikoivia pyyhkäisyalueita vastaavilla alueilla oli huomattavasti pienempi kuin G. soja -lajikkeiden genomin muissa osissa (parittainen Studentin t-testi, p-arvo = 0,002667, kuva 5a). Sitä vastoin G. sojan fragmenttien osuus valikoivilla pyyhkäisyalueilla verrattuna genomin muuhun osaan oli huomattavasti pienempi G. max -liitoksissa (parittainen Studentin t-testi, p-arvo = 2.542e-09, kuva 5c).

Kuva 5c. 5
kuvio5

Luonnollisen valinnan ja keinotekoisen valinnan mallit genomista introgressiota vastaan. a Valikoivilla pyyhkäisyalueilla havaittujen introgressoitujen G. max -fragmenttien osuudet verrattuna koko genomissa havaittuihin osuuksiin, joita havaittiin G. soja-alipopulaatiossa. b Kotieläintuotantoon liittyvillä QTL-alueilla olevien introgressoitujen G. max -fragmenttien osuudet verrattuna G. soja-alipopulaatiossa havaittuihin koko genomissa oleviin fragmentteihin. c Valikoivilla pyyhkäisyalueilla olevien introgressoitujen G. soja -fragmenttien osuudet verrattuna G. max -alipopulaatiossa havaittuihin koko genomissa oleviin fragmentteihin. d Kotieläintuotantoon liittyvillä QTL-alueilla olevien introgressoitujen G. soja -fragmenttien osuudet verrattuna koko genomissa havaittuihin koko genomiin. Merkitsevä ero kussakin vertailussa laskettiin parittaisella Studentin t-testillä. ***p < 0.001

Lisäksi arvioimme introgressoitujen fragmenttien osuudet 44:llä soijan domestikaation taustalla olevalla QTL-alueella (Kuva 2). Nämä QTL-alueet on äskettäin tunnistettu käyttämällä noin 800:aa rekombinanttia sisäsiitoslinjaa (RIL), jotka on saatu risteyttämällä Williams 82 ja kumpikin kahdesta G. soja -liitoksesta PI 468916 (s14) ja PI 479752 (s15) . Havaitsimme, että introgressoituneiden fragmenttien osuus joko G. max- tai G. soja -liitosten vastaavilla domestikaation QTL-alueilla on jopa pienempi kuin valikoivilla pyyhkäisyalueilla havaittu osuus (Kuva 5b, d). Yhdessä nämä havainnot viittaavat kaksisuuntaisen valinnan erilaisiin tuloksiin ja vaikutuksiin, ts, luonnollisesta valinnasta ja keinotekoisesta valinnasta introgression aiheuttamien fragmenttien säilymiseen G. soja- ja G. max -alipopulaatioissa.

Introgression välittämä geenivirta keskeisten domestikaatiogeenejä ympäröivien geenien ympärillä

Geenivirran tärkeimmäksi väyläksi geenivirtaan on havaittu genominen introgressio; pohdimme, miten geenivirta on saattanut vaikuttaa domestikaatioprosessiin ja soijapavun perimän geneettiseen arkkitehtuuriin populaation tasolla. Äskettäin on eristetty kaksi keskeistä soijapavun domestikaatiogeeniä GmHs1-1 ja Bloom1 (B1), jotka kontrolloivat siementen kovuutta ja siemenkuoren kukintaa. Siemenkuoren läpäisemättömyyttä ja kukintaa pidettiin tärkeinä tai välttämättöminä luonnonvaraisten soijapapujen pitkän aikavälin selviytymisen kannalta, kun taas läpäisevää siemenkuorta, jossa ei ole kukintaa, pidettiin suotavana maataloustuotannon ja ihmisten kulutuksen kannalta, ja se oli kotieläinjalostuksen yhteydessä valinnan kohteena. Keskeisen domestikaatiomuutoksen kausaalimutaatio kussakin kahdessa lokuksessa tunnistettiin ja validoitiin toiminnallisesti. Resessiivinen mutaatio (C→T) GmHs1-1:n koodaavalla alueella johti siirtymiseen luonnonvaraisen soijapavun läpäisemättömästä siemenkuoresta läpäisevään siemenkuoreen viljellyssä soijapavussa, ja kesytetyn alleelin Gmhs1-1 valinta muodosti ~ 160 kilotavun pituisen valikoivan pyyhkäisyalueen . B1:n koodaavalla alueella esiintyvä resessiivinen mutaatio (C→T) aiheutti siemenkuoren kukinnan häviämisen viljellyissä soijapavuissa, ja kesytetyn alleelin b1 valinta muodosti ~ 301 kilotavun valikoivan pyyhkäisyalueen . Tietojemme mukaan nämä ovat tähän mennessä ainoat kaksi tunnistettua geeniä, joiden kaksi alleelia voivat lähes yksinomaan erottaa luonnonvaraiset soijapavut viljellyistä soijapavuista, ja samalla identtinen kausaalimutaatio kummassakin näistä kahdesta lokuksesta, jotka aiheuttavat kotieläinlajin fenotyypit, on yhteinen viljellyille soijapavuille.

Käyttämällä SNP:tä kahdella GmHS1-1/Gmhs1-1- ja B1/b1-lokuksia ympäröivällä valikoivalla pyyhkäisyalueella konstruoimme fylogeneettiset suhteet 62 G. soja -lajikkeen ja 129 maatiaislajikkeen välillä. Fylogeneettiset suhteet määrittelivät oletetun introgression, johon liittyy kaksi valikoivaa pyyhkäisyaluetta. Noin 160 kilotavun GmHs1-1/Gmhs1-1-alueella 13:lla maatiaislajikkeella havaittiin olevan G. soja-lajikkeen kaltainen GmHs1-1-alue, kun taas vain yhdellä G. soja -lajikkeella, PI 366121 (s58), havaittiin olevan G. max -lajikkeen kaltainen Gmhs1-1-alue (kuva 6a). G. sojan kaltaiset GmHs1-1-alueet, joita löytyi 13 maatiaislajikkeesta, olivat hajallaan kaikissa G. soja -populaation tärkeimmissä kladeissa (kuva 6a), kun taas vain osa GmHs1-1-alueiden kladeista saattoi olla Gmhs1-1-alleelin valinnan lähde kotieläintuotannon aikana. Näin ollen näiden maatiaisrotujen erilaiset GmHs1-1-alueet olivat todennäköisemmin tulosta lajien välisestä introgressiosta. Noin 301 kilotavun B1/b1-alueella PI 339734 paljastui ainoaksi maatiaislajikkeeksi, jolla oli G. sojan kaltainen B1-alue, kun taas PI 549046 (s28) havaittiin ainoaksi G. soja -lajikkeen liittymäksi, joka sisälsi G. maxin kaltaisen b1-alueen (kuva 6b), joka on lähes identtinen G. max -lajikkeen PI 437654 (m47) B1-alueen kanssa (kuva 6b). Tämä G. soja -liittymä ryhmiteltiin fylogeneettisesti koko genomin tasolla kladiin, joka on kaukana muista G. soja -kladeista, jotka ovat lähellä G. max -lajiketta (kuva 1), mikä viittaa siihen, että tämän G. soja -liittymän b1-alue on todennäköisesti peräisin G. max -lajikkeesta geenivirran kautta. Tähdillä on merkitty G. soja ja G. max -liitokset, jotka sisältävät introgressiivisia fragmentteja G. maxista ja G. sojasta

Selektiiviset pyyhkäisyalueet, jotka ympäröivät domestikaation QTL:iä, ovat yleensä havaittavissa populaatiotasolla, mutta valinnan kohteena olevien spesifisten haplotyyppien rajat tietyllä valikoivalla pyyhkäisyalueella vaihtelevat yksittäisten liitosten välillä. Seurataksemme tarkemmin geenivirran jalanjälkiä, jotka liittyvät näihin keskeisiin domestikaatiolokuksiin, keskityimme kahteen domestikaatiogeeniin ja niiden vierekkäisiin sekvensseihin, mukaan luettuina niiden oletetut promoottori- ja terminaattorisekvenssit, ja keskityimme aiheuttavaan mutaatioon, joka johti domestikaatioalleeliin kummassakin lokuksessa. GmHs1-1/Gmhs1-1-lokuksen osalta havaittiin, että 13 maatiaislajilla oli yhteinen G. soja tai G. sojan kaltainen haplotyyppi, joka sisälsi GmHs1-1-spesifisen nukleotidin (C), kun taas seitsemällä G. soja -lajikkeella havaittiin olevan G. max tai G. maxin kaltainen haplotyyppi, joka sisälsi Gmhs1-1-spesifisen nukleotidin (T) (kuvio 6a ja lisätiedosto 2: kuva S4). Yhdenmukaisesti B1/b1-pyyhkäisyalueiden fylogenian kanssa 191 liittymän välillä (kuva 6b), G. soja PI 549046:lla (s28) todettiin olevan b1-haplotyyppi, mukaan lukien b1:n kausaalimutaatio (T), joka on identtinen 191 maatiaislajikkeen haplotyypin kanssa, kun taas maatiaislajikkeen PI 339734 (m30) haplotyyppi on hyvin identtinen useimpien G. soja -lajikkeiden haplotyyppien kanssa, mukaan lukien B1-spesifinen nukleotidi (C) (lisätiedosto 2: kuva S5). Kun otetaan huomioon G. soja ja G. max -alipopulaatioiden fylogeneettinen ero, valikoivien pyyhkäisyalueiden ja haplotyyppien havaittua sekoittumista kahdella kesytysgeenilokilla tutkitussa populaatiossa voidaan pitää lisätodisteena alapopulaatioiden välisestä geenivirrasta.

Introgressio paljastuu epäsymmetrisestä diversifikaatiosta ydin- ja organellargenomien välillä

Kun otetaan huomioon, että G. sojan ja G. maxin väliset risteytykset voidaan helposti tehdä tuottamaan hedelmällisiä siemeniä, tässä tutkimuksessa havaitun introgression tai geenivirtauksen, sellaisena kuin se on edellä kuvattu, ajateltiin olevan jäänteitä spontaanien hybridisaatiokierrosten jäänteistä, jotka koskivat kyseisiä kahta geenivarastoa siitepölyn ja/tai siementen leviämisen kautta. Teoriassa osa hybridisaatiotapahtumista voitaisiin havaita vertaamalla niiden organellarisia genomeja niiden ydingenomien määrittelemän geneettisen arkkitehtuurin yhteydessä. Analysoimme näin ollen 191 uudelleen sekvensoidun soijapapumerkinnän kloroplastigenomisekvenssejä . Kloroplastien 191 genomista tunnistettiin yhteensä 333 erittäin tarkkaa SNP:tä, joita käytettiin fylogeneettisen puun rakentamiseen (kuva 7). Kaiken kaikkiaan 191 kloroplastigenomia ryhmiteltiin kahteen alaryhmään, G. max -alaryhmään ja G. soja -alaryhmään. Odotetusti G. max -alaryhmään kuuluvien G. max -liitosten kloroplastigenomit eroavat toisistaan vähemmän kuin G. soja -alaryhmään kuuluvien G. soja -liitosten genomit. Huolimatta kloroplastien genomien selvästä erosta G. max- ja G. soja -alaryhmien välillä 24 G. max -liittymää ryhmiteltiin G. soja -alaryhmään ja 3 G. soja -liittymää ryhmiteltiin G. max -alaryhmään (kuva 7). Nämä havainnot viittaavat G. soja-G. max -hybridisaatiotapahtumiin, joissa emovanhempana on joko G. soja tai G. max. Tällaiset tapahtumat ovat ilmeisesti muokanneet sekä G. soja- että G. max -alaryhmien ydingenomien geneettistä arkkitehtuuria.

Kuvio 7
kuvio7

Ydin- ja kloroplastigenomien epäsymmetrinen eroavaisuus G. max- ja G. soja -liitosten välillä. 191 liittymän ydingenomien fylogeneettinen puu muodostettiin käyttämällä kaikkia koko genomissa havaittuja SNP:itä, kun taas saman liittymäjoukon kloroplastin fylogeneettinen puu muodostettiin käyttämällä 333:a erittäin luotettavaa SNP:tä, jotka jakautuivat kloroplastin genomiin. G. max -liitokset on merkitty kahden puun sinisillä oksilla ja sinisillä pisteillä, kun taas G. soja -liitokset on merkitty kahden puun punaisilla oksilla ja punaisilla pisteillä. Kahden puun samat liittymät oli yhdistetty viivoilla. soja -lajikkeiden osalta, joilla on vastaavat G. max- ja G. soja -kloroplastit, niiden ydingenomien mukaan läheisimmin sukua olevilla lajikkeilla on taipumus jakaa identtiset tai samankaltaisemmat kloroplastien genomien haplotyypit (Kuva 7 ja Additional file 2: Kuva S6), mikä viittaa ydingenomien ja kloroplastien genomien yhteisevoluutioon yleisenä mallina. Kuitenkin havaittiin myös ilmeisiä poikkeuksia. Esimerkiksi joillakin liittymillä, joiden ydingenomit poikkesivat suuresti toisistaan, havaittiin olevan identtisiä tai lähes identtisiä kloroplastien genomien haplotyyppejä, ja joillakin liittymillä, joiden ydingenomit olivat lähempänä toisiaan, havaittiin olevan kloroplastien genomien haplotyyppejä, jotka poikkesivat toisistaan enemmän toisistaan (lisätiedosto 2: kuva S6). Tällaiset poikkeukset viittaavat siihen, että G. max -alipopulaation tai G. soja -alipopulaation sisällä on esiintynyt myös hybridisaatiotapahtumia niiden ydingenomien suhteen hyvin erilaisten liittymien välillä, ja tällaiset tapahtumat ovat hyvin todennäköisesti vastuussa havaitusta ennennäkemättömästä lajikkeiden monipuolistumisesta ydin- ja kloroplastigenomien välillä.

Vastaa

Sähköpostiosoitettasi ei julkaista.