Genomische introgressie door interspecifieke hybridisatie gaat genetische bottleneck tegen tijdens domesticatie van sojabonen

Genoomwijde identificatie van putatieve G. soja-G. max introgressie

Om genoombrede introgressie tussen gecultiveerde en wilde sojabonen te onderzoeken, analyseerden we de volledige genoomsequencing gegevens van een representatieve sojapopulatie die 62 G. soja-toegangen, 130 landrassen en 110 verbeterde sojacultivars omvatte, verzameld uit diverse eco-geografische regio’s in China en uit andere landen waaronder Korea, Japan, Rusland, de VS en Canada. Deze stalen waren verdeeld over bijna alle belangrijke fylogenetische clades/groepen van 18.480 gedomesticeerde sojatoeties en 1168 wilde sojatoeties verzameld in 84 landen of ontwikkeld in de VS, die gedeponeerd zijn in de USDA Sojaboon Germplasm Collection (USDA) en dus beschouwd worden als zeer representatief voor de genetische diversiteit van sojabonen. Eerst identificeerden we lokale regionale haplotypes in elk van de 62 G. soja- en 240 G. max-toegangen die identiek waren door afstamming (IBD) aan individuen binnen de G. soja- en G. max-subpopulaties, gebruik makend van alle SNP-gegevens van de 302 toetredingen volgens een eerder beschreven aanpak. Om de frequenties van de gedeelde haplotypes in verschillende regio’s langs elk chromosoom van het sojaboongenoom te berekenen, verdeelden we elk chromosoom in bins van 10 kb en berekenden de aantallen geregistreerde IBD traktaten tussen elke toetreding en de twee G. soja en G. max subpopulaties per bin door paarsgewijze vergelijkingen. Deze aantallen werden genormaliseerd van 0 (geen IBD waargenomen) tot 1 (IBD gedeeld door alle individuen binnen een subpopulatie), en de genormaliseerde IBD tussen elke toetreding en de G. soja subpopulatie (nIBDG. soja) en tussen elke toetreding en de G. max subpopulatie (nIBDG. max) werden gebruikt om de relatieve IBD (rIBD) tussen de vergeleken groepen te berekenen (rIBD = nIBDG. soja – nIBDG. max). Tenslotte werd de vermeende genomische introgressie van de G. soja subpopulatie naar elk van de gecultiveerde soja-accessies en van de G. max subpopulatie naar elk van de wilde soja-accessies geïdentificeerd.

Met deze aanpak werd bij 297 van de 302 accessies vermeende interspecifieke introgressie gevonden (Additional file 1: Tabel S1, Additional file 2: Figuur S1). De 110 elite rassen werden uitgesloten van verdere analyses, omdat deze rassen relatief kleinere percentages introgressie van de wilde sojaboon vertoonden (0,00015~0,03) en omdat bij de ontwikkeling van deze rassen door de mens veroorzaakte hybridisatie optrad, die natuurlijk voorkomende introgressiegebeurtenissen zou kunnen verdoezelen. Eén landras werd ook uitgesloten van verdere analyses omwille van de relatief lage kwaliteit van de genomische sequenties en het hoge niveau van heterozygositeit. Onder de overblijvende accessies waaronder 62 G. soja accessies en 129 landrassen, variëren de proporties van gedetecteerde introgressie fragmenten in individuele genomen van 0.00037 tot 0.60, met een gemiddelde van 0.032 (Fig. 1, Additional file 1: Tabel S1). De chromosomale verdeling van de gedetecteerde introgressie in accessies met > 0,05 (5%) geïntrogresseerde fragmenten in individuele genomen (Additional file 1: Tabel S1) worden geïllustreerd in Fig. 2. Onder de G. soja genomen, de proporties van gedetecteerde G. max fragmenten variëren van 0.00059 tot 0.41, met een gemiddelde van 0.019 (Additional file 2: Figuur S1, bovenste paneel). Onder de G. max genomen, de proporties van gedetecteerde G. soja fragmenten variëren van 0,00037 tot 0,60, met een gemiddelde van 0,031 (Additional file 2: Figuur S1, onderste paneel). In totaal, 43,94% en 54,61% van de vermeende introgressed fragmenten in de G. soja en G. max subpopulaties worden gedeeld door twee of meer toetredingen, en de resterende zijn toetreding-specifieke (Additional file 2: figuur S2). Geen van de veronderstelde introgressiefragmenten die in deze studie werden gedetecteerd, was volledig gefixeerd in de subpopulaties van G. soja of G. max (fig. 2).

Fig. 1
figure1

Phylogenetische naburige-joining boom van een panel van wilde en gecultiveerde sojabonen. De boom is geconstrueerd op basis van genoombrede SNP’s die zijn gedetecteerd door genoomresequencing met behulp van het MEGA-programma. De rood en blauw gemarkeerde takken geven respectievelijk G. soja en G. max (landras) aan. De codes voor de individuele toetredingen en de fractie van geïnteregresseerde fragmenten worden getoond in de buitenlagen van de boom

Fig. 2
figure2

Genome-brede verdeling van interspecifieke introgressie en genomische kenmerken. De ringen van de cirkel, van buiten naar binnen, tonen chromosomen met inbegrip van (i) chromosoom armen (grijze kleur) en pericentromeric regio’s (groene kleur), (ii) chromosomale verdeling van introgressie in de gehele populatie, (iii) chromosomale verdeling van domesticatie-gerelateerde QTL zoals aangegeven door rode balken in overeenkomstige ring, (iv) chromosomale verdeling van selectieve sweeps zoals aangegeven door rode balken in overeenkomstige ring, (v) chromosomale verdeling van interspecifieke introgressie in elk van de 12 G. max en 10 G. soja, zoals aangegeven door de 22 ringen, waarvan de genomen elk meer dan 5% geïnterogresseerde fragmenten bevatten. In deze 22 ringen zijn de G. max segmenten in blauw weergegeven en de G. soja segmenten in oranje

Eerdere analyses van populatiestructuur en vermenging in sojabonen hebben lokale genomische regio’s aan het licht gebracht die uitzonderlijke overeenkomsten vertonen tussen G. soja en G. max (5, 7), die werden beschouwd als bewijs van genomische introgressie. De hierboven beschreven rIBD-analyse die de lokale genomische regio’s definieert van de individuele accessies die betrokken zijn bij vermeende introgressie, levert verder bewijs voor G. soja-G. max introgressie. Toch blijft de mogelijkheid bestaan dat een deel van de vermeende introgressie, in het bijzonder vermeende G. soja fragmenten die in de G. max achtergrond werden gedetecteerd, het gevolg zijn van een onvolledige lineage sortering van voorouderlijke polymorfismen in de bronpopulatie die in het domesticatieproces werd gebruikt. In een poging om bijkomend bewijs te verzamelen om de hypothese van introgressie te ondersteunen, voerden we D-statistische analyse uit voor de grote vermeende G. max-geïntrogresseerde regio’s die gedetecteerd werden in de 8 G. soja-accessies (Fig. 2) in paarsgewijze vergelijking met 10 willekeurig geselecteerde G. max-regio’s zonder gedetecteerde introgressie (Fig. 1) en voor de grote vermoedelijke G. soja-introgressiegebieden die gedetecteerd werden in de 14 G. max-regio’s (Fig. 2) in paarsgewijze vergelijking met 10 willekeurig geselecteerde G. soja-regio’s zonder gedetecteerde introgressie (Fig. 1). Zoals getoond in Fig. 3a, was de D-statistic voor de regio’s met vermoedelijke introgressie (D = – 0.15 ± 0.07) significant lager dan de regio’s zonder vermoedelijke introgressie (D = – 0.08 ± 0.05) en was ook significant lager dan het genoom-brede gemiddelde (D = – 0.11 ± 0.04), wat suggereert dat genenstroom tussen de G. soja en G. max taxa betrokken was bij deze genomische regio’s met ontdekte vermoedelijke introgressie.

Fig. 3
figure3

D-statistische analyse onthult verschillende patronen van genenstroom in verschillende regio’s tussen G. soja en G. max. Een D-statistiek voor grote vermeende G. max-geïntrogresseerde regio’s die zijn ontdekt in de 8 G. soja-toegangen/grote vermoedelijke G. soja-geïntrogresseerde regio’s die zijn ontdekt in de 14 G. max-toegangen in paarsgewijze vergelijking met die regio’s in willekeurig geselecteerde 10 G. max toegang/10 G. max toegang zonder gedetecteerde interspecifieke introgressie versus regio’s zonder vermeende introgressie. b D-statistiek voor pericentromerische regio’s versus chromosomale armen in de paarsgewijze vergelijking tussen toegang zoals beschreven in a. Significante verschillen (p-waarden < 0.05) tussen vergeleken regio’s, zoals aangegeven met verschillende letters in de boxblots, werden gedetecteerd met de Kolmogorov-Smirnov test

In een poging om de oorsprong van de gedetecteerde introgressie te achterhalen, vergeleken we grote en representatieve introgressiesegmenten in een G. soja-toetreding (PI 578357, s61) en een landras (PI 339734, m30), die naar schatting respectievelijk 33% en 31% introgressiefragmenten bevatten, vergeleken met overeenkomstige regio’s in andere toetredingen. Genoomwijde vermeende introgressie in een G. soja toetreding PI 578357 (s61), een van de G. soja toetredingen grenzend aan de G. max clades, werd geïllustreerd in Fig. 4b en Additioneel bestand 2: Figure S3.

Fig. 4
figure4

Exemplificatie van introgressie en vermoedelijke oorsprong van introgressie geïllustreerd door relatieve identiek door afstamming (rIBD). a-c Genomische component langs chromosoom 2 in drie verwante toetredingen Heihexiaohuangdou, PI 578357, en PI 522226. Een G. soja-toetreding (b) draagt geïnteregresseerde G. max fragmenten die de grootste overeenkomst vertonen met de overeenkomstige regio’s van een landras (a), en de G. soja segmenten die de grootste overeenkomst vertonen met de overeenkomstige regio’s van een G. soja-toetreding (c). d De cladogramboom gebaseerd op SNPs in de introgressiegebieden van chromosoom 2 toont de G. max (Heihexiaohuangdou, blauw) oorsprong van de regio’s in G. soja toetreding PI 578357, zoals aangegeven door de pijl. e De cladogram boom gebaseerd op SNPs in de niet-introgressie regio’s toont de G. soja (PI 522226, rood) oorsprong van de regio’s in PI 578357, zoals aangegeven door de pijl. f Geografische spreiding van de drie verwante toetredingen. g-i Genomische component langs chromosoom 19 in drie verwante toetredingen PI 548456, PI 339734, en PI 407275. Een G. max-toetreding (h) draagt introgressed G. soja fragmenten die de grootste overeenkomst vertonen met de overeenkomstige regio’s van een G. soja-toetreding (i) en de G. max segmenten die de grootste overeenkomst vertonen met de overeenkomstige regio’s van een G. max-toetreding (g). j De cladogramboom gebaseerd op SNPs in de niet-introgressieregio’s die de G. max (PI 548456, blauw) oorsprong toont van de regio’s in PI 339734, zoals aangegeven door de pijl. k De cladogramboom gebaseerd op SNPs in de introgressieregio’s van chromosoom 2 die de G. soja (PI 407275, rood) van de regio’s in G. max toetreding PI 339734, zoals aangegeven door de pijl. l Geografische verdeling van de drie verwante toetredingen

De introgressieregio’s in PI 578357 omvatten de gehele pericentromerische regio van chromosoom 2 zonder eerder gedetecteerde domesticatie QTL’s (Fig. 2) en werden daarom geacht minimale selectieve druk te hebben ondergaan voor hun behoud. Wij vonden dat de onderzochte regio’s van chromosoom 2 in PI 578357, geteeld in Amur, Rusland, de hoogste sequentie gelijkenis vertonen met hun corresponderende regio’s in een landras Heihexiaohuangdou (m104), geteeld in Heihe, China (Fig. 4a, b, d, f). Daarentegen vertonen de niet-introgressieregio’s van PI 578357 de grootste overeenkomst met hun overeenkomstige regio’s in een G. soja-toetreding PI 522226 (s5), gekweekt in Primorye, Rusland (Fig. 4b, c, e, f), die een van de G. soja-toetredingen is die het meest van PI 578357 en van de G. max-lijn (Fig. 1) is gedivergeerd, en dus waarschijnlijk niet betrokken is bij of afgeleid is van de bronpopulatie die voor de domesticatie van soja werd gebruikt. De introgressie regio’s van chromosoom 19 in PI 339734, een landras geteeld in Korea, bleken de hoogste sequentie gelijkenis te delen met hun corresponderende regio’s in een G. soja toetreding PI 407275 (s42) die ook in Korea geteeld werd (Fig. 4h, i, k, l). Daarentegen vertonen de niet-introgressieregio’s van PI 339734 de grootste overeenkomst met hun overeenkomstige regio’s in een landras PI 548456 (m111) dat ook in Pyongyang, Noord-Korea, werd geteeld (Fig. 4g, h, j, l). De geografische spreiding, de patronen en niveaus van sequentieovereenkomst en -divergentie van lokale genomische regio’s, en de volledige genoomwijde sequentiediversiteit en fylogenie van deze accessies suggereren samen dat het gedetecteerde chimerisme van chromosomen, zoals hierboven beschreven, hoogstwaarschijnlijk het gevolg was van interspecifieke introgressie in plaats van onvolledige lineage sortering van voorouderlijke polymorfismen in de bronpopulatie voor de domesticatie van soja. Gebaseerd op gensequenties in het volledige genoom, werden de divergentie tijden tussen PI 578357 en Heihexiaohuangdou en tussen PI 339734 en PI 407275 gedateerd op ~ 0.37 en 0.27 miljoen jaar geleden (mya), respectievelijk. Aangezien de domesticatie van soja slechts ~ 6000-9000 jaar geleden plaatsvond, moet een dergelijk hoog niveau van overeenkomsten van de onderzochte introgressieregio’s tussen de twee paren van (G. soja-G. max) hierboven geïllustreerde accessies worden beschouwd als direct bewijs van introgressie tussen G. soja en G. max.

Factoren die het landschap van G. soja-G. max introgressie bepalen. max introgressie

Om de evolutionaire krachten te begrijpen die de verdeling van genomische introgressie in de twee subpopulaties bepalen, vergeleken we eerst de gemiddelde proporties van geïntrogresseerde fragmenten tussen pericentromerische regio’s en chromosomale armen die ruwweg werden gedefinieerd op basis van de snelheid van lokale genetische recombinatie en de fysieke posities van centromeer-verrijkte herhalingen in het sojaboongenoom. In het algemeen vertonen pericentromerische regio’s sterk verlaagde percentages van genetische recombinatie en vertekende accumulatie voor schadelijke mutaties zoals de invoeging van transposable elementen in vergelijking met chromosomale armen. We vonden dat, ondanks enkele uitzonderingen, over het algemeen de pericentromeric regio’s hogere proporties van introgressed fragmenten hebben in hetzij de G. soja subpopulatie of de G. max subpopulatie (gepaarde Student t-test, p waarde < 0,01, Fig. 2 en Additional file 3: Tabel S2). D-statistische analyse voor pericentromerische regio’s in vergelijking met armen werd uitgevoerd met behulp van dezelfde subset van G. max en G. soja accessies. Zoals getoond in Fig. 3b, was de D-statistiek voor de pericentromeric regio’s (D = – 0,12 ± 0,06) significant lager dan de chromosoom armen (D = – 0,09 ± 0,02) (Fig. 3b), wat suggereert een vertekende accumulatie van genenstroom in pericentromeric regio’s. Een dergelijke vertekening kan gedeeltelijk het gevolg zijn van de verminderde snelheid van genetische recombinatie en dus een verminderde efficiëntie in het zuiveren van geïntrogresseerde variatie/fragmenten in pericentromerische regio’s in vergelijking met chromosomale armen.

In theorie zou genomische introgressie het gevolg moeten zijn van spontane hybridisatie, en daaropvolgende terugkruisingen tussen G. soja en G. max moeten twee verschillende selectiedrukken ondergaan hebben: natuurlijke selectie voor de wilde eigenschappen met het oog op de vorming van G. soja of G. soja-achtige accessies die zich aanpassen aan de natuurlijke omgeving versus kunstmatige selectie voor gecultiveerde eigenschappen met het oog op de ontwikkeling van G. max of G. max-achtige accessies die geschikt zijn voor de teelt. Als dit het geval is, verwachten we dat er verschillende distributiepatronen van introgressiefragmenten tussen de G. soja en G. max subpopulaties. Om deze hypothese te testen, hebben we eerst de proporties geschat van de geïntegradeerde fragmenten in 122 selectieve vegen (Fig. 2) die een ernstige vermindering van nucleotide variatie vertoonden van de G. soja subpopulatie naar de G. max subpopulatie. Deze regio’s in gecultiveerde sojabonen waren waarschijnlijk het gevolg van sterke selectieve druk op bepaalde loci geassocieerd met de domesticatie van sojabonen. Zoals verwacht, werd een significant lager aandeel van G. max fragmenten in de regio’s die overeenkomen met de selectieve veeggebieden in vergelijking met het resterende deel van het genoom gedetecteerd in de G. soja toetredingen (gepaarde Student t test, p waarde = 0,002667, Fig. 5a). Daarentegen werd een significant lager aandeel van G. soja-fragmenten in de selectieve veeggebieden in vergelijking met het resterende deel van het genoom gedetecteerd in de G. max-accessies (gepaarde Student t-test, p-waarde = 2,542e-09, fig. 5c).

Fig. 5
figure5

Patronen van natuurlijke selectie en kunstmatige selectie tegen genomische introgressie. a Proporties van geïntrogresseerde G. max-fragmenten in selectieve veeggebieden vergeleken met die in het volledige genoom, gedetecteerd in de G. soja-subpopulatie. b Verhouding van geëxtrogresseerde G. max-fragmenten in aan domesticatie gerelateerde QTL-gebieden vergeleken met die in het volledige genoom, opgespoord in de G. soja-subpopulatie. c Verhouding van geëxtrogresseerde G. soja-fragmenten in selectieve veeggebieden vergeleken met die in het volledige genoom, opgespoord in de G. max-subpopulatie. d Verhouding van geëxtrogresseerde G. soja-fragmenten in aan domesticatie gerelateerde QTL-gebieden vergeleken met die in het volledige genoom, opgespoord in de G. max-subpopulatie. Significant verschil in elke vergelijking werd berekend door gepaarde Student t-test. ***p < 0.001

Daarnaast maakten we een schatting van de proporties van geïntrogresseerde fragmenten in 44 QTL-regio’s die aan de domesticatie van soja ten grondslag liggen (Fig. 2). Deze QTL’s werden onlangs geïdentificeerd met behulp van ongeveer 800 recombinant inteeltlijnen (RIL), afgeleid van kruisingen tussen Williams 82 en elk van de twee G. soja-accessies PI 468916 (s14) en PI 479752 (s15) . We ontdekten dat het aandeel van geïntegradeerde fragmenten in de overeenkomstige domesticatie QTL regio’s van ofwel de G. max of G. soja toegang zelfs kleiner is dan ontdekt in de selectieve veeg regio’s (Fig. 5b, d). Samen wijzen deze waarnemingen op verschillende uitkomsten en effecten van bidirectionele selectie, d.w.z,

Introgressie-gemedieerde genenstroom rond belangrijke domesticatiegenen

Genomische introgressie is gerealiseerd als een belangrijke weg voor genenstroom; we vroegen ons af hoe genenstroom het domesticatieproces en de genetische architectuur van het sojaboongenoom op populatieniveau kan hebben beïnvloed. Onlangs werden twee belangrijke domesticatiegenen van soja geïsoleerd, GmHs1-1 en Bloom1 (B1), die respectievelijk de verharding en de bloei van de zaadmantel controleren. Ondoorlaatbaarheid van de zaadhuid en bloei werden als belangrijk of essentieel beschouwd voor het overleven op lange termijn van wilde sojabonen, terwijl een doorlaatbare zaadhuid zonder bloei wenselijk was voor de landbouwproductie en de menselijke consumptie en als doelwit voor selectie bij domesticatie. De causale mutatie op elk van de twee loci voor de sleutelovergang naar domesticatie werd geïdentificeerd en functioneel gevalideerd. Een recessieve mutatie (C→T) in de coderende regio van GmHs1-1 resulteerde in de overgang van een ondoordringbare zaadmantel bij wilde soja naar een doordringbare zaadmantel bij geteelde soja, en selectie voor het gedomesticeerde allel Gmhs1-1 vormde een ~ 160-kb selectief veeggebied. Een recessieve mutatie (C→T) in de coderende regio van B1 was verantwoordelijk voor het verlies van zaadvliesbloei in de geteelde sojabonen, en selectie van het gedomesticeerde allel b1 resulteerde in een ~ 301-kb selectieve veegregio . Voor zover wij weten, zijn dit de enige twee tot nu toe geïdentificeerde genen waarvan de twee allelen bijna uitsluitend de wilde sojabonen van de geteelde sojabonen kunnen onderscheiden, en ondertussen wordt de identieke causale mutatie op elk van de twee loci voor de gedomesticeerde fenotypen gedeeld door de geteelde sojabonen.

Met behulp van SNPs in de twee selectieve veeggebieden rond de GmHS1-1/Gmhs1-1 en B1/b1 loci, construeerden we de fylogenetische relaties tussen de 62 G. soja-accessies en 129 landrassen. Veronderstelde introgressie waarbij de twee selectieve veeggebieden betrokken waren, werd door de fylogenetische relaties bepaald. In de ~ 160-kb GmHs1-1/Gmhs1-1 regio, bleken 13 landrassen G. soja-achtige GmHs1-1 regio te bezitten, terwijl slechts 1 G. soja toetreding, PI 366121 (s58), de G. max-achtige Gmhs1-1 regio bleek te bezitten (Fig. 6a). De G. soja-achtige GmHs1-1 regio’s gevonden in de 13 landrassen waren verspreid over alle belangrijke clades van de G. soja populatie (Fig. 6a), terwijl slechts een subset van de clades van de GmHs1-1 regio’s de bron kan zijn voor selectie voor het Gmhs1-1 allel tijdens domesticatie. De verschillende GmHs1-1 regio’s in deze landrassen zijn dus waarschijnlijk het gevolg van interspecifieke introgressie. In de ~ 301-kb B1/b1 regio, bleek PI 339734 het enige landras te zijn dat de G. soja-achtige B1 regio bezat, terwijl PI 549046 (s28) de enige G. soja toetreding bleek te zijn die de G. max-achtige b1 regio bevatte (Fig. 6b), die bijna identiek is aan die van een G. max variëteit PI 437654 (m47) (Fig. 6b). Deze G. soja toetreding was fylogenetisch gegroepeerd, op het niveau van het gehele genoom, in een clade die ver verwijderd is van andere G. soja clades grenzend aan G. max (Fig. 1), wat suggereert dat de b1 regio in deze G. soja toetreding waarschijnlijk is ontstaan uit G. max door genenstroom. Van deze landrassen is PI 339734 de enige die zowel de GmHs1-1 als de B1 regio’s verwerkt (Fig. 6a, b).

Fig. 6
figure6

Phylogenetische relaties tussen de 191 toetredingen onthuld door vergelijking met twee selectieve veegregio’s. a De GmHs1-1 regio en b de B1 regio. Asterisken geven de G. soja- en G. max-toestanden aan die respectievelijk introgressiefragmenten van G. max en G. soja bevatten

Selectieve vegen rond domesticatie-QTL’s zijn over het algemeen detecteerbaar op populatieniveau, maar de grenzen van specifieke haplotypen die binnen een bepaalde selectieve veegregio worden geselecteerd, variëren tussen individuele toetredingen. Om de sporen van de genenstroom rond deze belangrijke domesticatieloci verder te volgen, zoomden we in op de twee domesticatiegenen en hun aangrenzende sequenties, inclusief de respectieve vermoedelijke promotor- en terminatorsequenties, met de nadruk op de oorzakelijke mutatie die resulteerde in het domesticatie-allel op elke locus. Op de GmHs1-1/Gmhs1-1 locus bleken 13 landrassen het G. soja of G. soja-achtige haplotype te delen, inclusief het GmHs1-1-specifieke nucleotide (C), terwijl 7 G. soja-accessies het G. max of G. max-achtige haplotype bleken te bezitten, inclusief het Gmhs1-1-specifieke nucleotide (T) (Fig. 6a en Additional file 2: Figuur S4). In overeenstemming met de fylogenie van de B1/b1-veegregio’s onder de 191 accessies (Fig. 6b), G. soja PI 549046 (s28) het b1 haplotype bezitten, inclusief de causale mutatie (T) voor b1, die identiek is aan die van 191 landrassen, terwijl het haplotype van landras PI 339734 (m30) in hoge mate identiek is aan die van de meerderheid van G. soja-accessies, inclusief B1-specifieke nucleotide (C) (Additional file 2: Figuur S5). Gezien het fylogenetische onderscheid tussen de subpopulaties G. soja en G. max, zou de ontdekte vermenging van de selectieve veeggebieden en haplotypen op de twee domesticatiegen loci in de onderzochte populatie worden beschouwd als verder bewijs van genenstroom tussen subpopulaties.

Introgressie onthuld door asymmetrische diversificatie tussen de nucleaire en organellaire genomen

Gezien het feit dat kruisingen tussen G. soja en G. max gemakkelijk kunnen worden gemaakt om vruchtbare zaden te produceren, werd de ontdekte introgressie of genenstroom in deze studie, zoals hierboven beschreven, verondersteld relicten te zijn van rondes van spontane hybridisatie waarbij deze twee genenpools betrokken waren via pollenverspreiding en/of zaadverspreiding. In theorie zouden sommige van de hybridisatie-events kunnen worden gedetecteerd door vergelijking met hun organellaire genomen in de context van de genetische architectuur gedefinieerd door hun nucleaire genomen. Daarom analyseerden wij de chloroplast genoomsequenties van de 191 opnieuw gesequencete sojaboontoegangen. Onder de 191 chloroplast-genomen werden in totaal 333 zeer nauwkeurige SNPs geïdentificeerd en vervolgens gebruikt om de fylogenetische boom te construeren (Fig. 7). Globaal werden de 191 chloroplast genomen geclusterd in 2 subgroepen, de G. max subgroep en de G. soja subgroep. Zoals verwacht zijn de chloroplastgenen van de G. max-accessies binnen de G. max-subgroep minder uiteenlopend dan die van de G. soja-accessies binnen de G. soja-subgroep. Ondanks het duidelijke onderscheid van de chloroplast genomen tussen de G. max en G. soja subgroepen, werden 24 G. max accessies geclusterd in de G. soja subgroep en 3 G. soja accessies werden geclusterd in de G. max subgroep (Fig. 7). Deze waarnemingen wijzen op het voorkomen van hybridisaties tussen G. soja en G. max met ofwel G. soja ofwel G. max als moederouder. Dergelijke gebeurtenissen hebben blijkbaar de genetische architectuur van de nucleaire genomen van zowel de G. soja- als de G. max-subpopulaties hervormd.

Fig. 7
figure7

Asymmetrische divergentie van de nucleaire en chloroplastgenomen tussen G. max- en G. soja-accessies. De fylogenetische boom van het nucleaire genoom van de 191 toetredingen werd geconstrueerd met behulp van alle SNP’s die in het volledige genoom werden gedetecteerd, terwijl de fylogenetische boom van de chloroplast van dezelfde reeks toetredingen werd geconstrueerd met behulp van 333 zeer betrouwbare SNP’s verspreid over het chloroplastgenoom. De G. max-toegangen werden aangeduid door blauwe takken van 2 bomen en gemarkeerd door blauwe stippen, terwijl de G. soja-toegangen werden aangeduid door rode takken van 2 bomen en gemarkeerd door rode stippen. Dezelfde accessies in de 2 bomen werden verbonden door lijnen. Blauwe lijnen geven G. max-toegangen aan die chloroplasten van het G. soja-type bezitten, oranje lijnen geven G. soja-toegangen aan die chloroplasten van het G. max-type bezitten, en grijze lijnen geven G. soja- en G. max-toegangen aan die chloroplasten van respectievelijk het G. soja- en het G. max-type bezitten

Voor de G. max- en G. soja-accessies die respectievelijk G. max- en G. soja-chloroplasten bezitten, hebben nauwer verwante accessies volgens hun nucleaire genomen de neiging om identieke of meer vergelijkbare haplotypen van hun chloroplastgenomen te delen (Fig. 7 en Additional file 2: Figuur S6), wat co-evolutie tussen de nucleaire genomen en de chloroplastgenomen als een algemeen patroon suggereert. Er werden echter ook duidelijke uitzonderingen waargenomen. Zo werden bijvoorbeeld bij sommige combinaties met sterk uiteenlopende nucleaire genomen identieke of bijna identieke haplotypen van de chloroplast genomen waargenomen, en bij sommige combinaties met nauwer verwante nucleaire genomen werden meer uiteenlopende haplotypen van de chloroplast genomen waargenomen (Additional file 2: Figuur S6). Dergelijke uitzonderingen suggereren dat er ook hybridisatie-evenementen hebben plaatsgevonden tussen sterk van elkaar afwijkende deelpopulaties in termen van hun nucleaire genomen binnen de G. max-subpopulatie of binnen de G. soja-subpopulatie, en dergelijke gebeurtenissen zijn zeer waarschijnlijk verantwoordelijk voor de waargenomen ongeëvenaarde variëteitsdiversificatie tussen de nucleaire en chloroplast-genomen.

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.