Genomisk introgression gennem interspecifik hybridisering modvirker genetisk flaskehals under domesticering af sojabønner

Genomisk identifikation af putative G. soja-G. max introgression

For at undersøge genom-dækkende introgression mellem dyrkede og vilde sojabønner analyserede vi hele genomet resekventeringsdata fra en repræsentativ sojabønnepopulation, der omfatter 62 G. soja-accessioner, 130 landracer og 110 forbedrede sojabønnesorter indsamlet fra forskellige øko-geografiske regioner i Kina og fra andre lande, herunder Korea, Japan, Rusland, USA og Canada. Disse prøver var fordelt på næsten alle større fylogenetiske klasser/grupper af 18 480 domesticerede sojabønneaccessioner og 1168 vilde sojabønneaccessioner indsamlet fra 84 lande eller udviklet i USA, som er deponeret i US Department of Agriculture (USDA) Soybean Germplasm Collection og således anses for at være meget repræsentative for den genetiske diversitet af sojabønner. Vi identificerede først lokale regionale haplotyper i hver af de 62 G. soja- og 240 G. max-accessioner, der var identiske ved afstamning (IBD) med individer inden for G. soja- og G. max-subpopulationerne ved hjælp af alle SNP-data fra de 302 accessioner efter en metode, der tidligere er beskrevet . For at beregne hyppighederne af de delte haplotyper i forskellige regioner langs hvert kromosom i sojabønne-genomet opdelte vi hvert kromosom i bins på 10 kb og beregnede antallet af registrerede IBD-strækninger mellem hver accession og de to G. soja- og G. max-subpopulationer pr. bin ved parvise sammenligninger. Disse tal blev normaliseret fra 0 (ingen IBD påvist) til 1 (IBD delt af alle individer inden for en subpopulation), og den normaliserede IBD mellem hver accession og G. soja-subpopulationen (nIBDG. soja) og mellem hver accession og G. max-subpopulationen (nIBDG. max) blev anvendt til at beregne den relative IBD (rIBD) mellem de sammenlignede grupper (rIBD = nIBDG. soja – nIBDG. max). Endelig blev den formodede genomiske introgression fra G. soja-subpopulationen til hver af de dyrkede sojabønneaccessioner og fra G. max-subpopulationen til hver af de vilde sojabønneaccessioner identificeret.

Gennem denne fremgangsmåde blev 297 af de 302 accessioner påvist at indeholde formodet interspecifik introgression (Yderligere fil 1: tabel S1, Yderligere fil 2: figur S1). De 110 elitesorter blev udelukket fra yderligere analyser, fordi disse sorter udviste relativt mindre introgression fra den vilde sojabønne (0,00015~0,03), og fordi udviklingen af disse sorter involverede menneskeskabt hybridisering, der kunne skjule naturligt forekommende introgressionshændelser. En landrace blev også udelukket fra yderligere analyser på grund af dens relativt lave kvalitet af genomiske sekvenser og høje niveau af heterozygotitet. Blandt de resterende accessioner, herunder 62 G. soja-accessioner og 129 landracer, varierer andelen af påviste introgresserede fragmenter i individuelle genomer fra 0,00037 til 0,60, med et gennemsnit på 0,032 (Fig. 1, Additional file 1: Table S1). Den kromosomale fordeling af den påviste introgression i accessioner med > 0,05 (5 %) introgresserede fragmenter i individuelle genomer (Additional file 1: Table S1) er illustreret i Fig. 2. Blandt G. soja-genomerne varierer andelen af påviste G. max-fragmenter fra 0,00059 til 0,41, med et gennemsnit på 0,019 (Additional file 2: Figur S1, øverste panel). Blandt G. max-genomerne varierer andelen af fundne G. soja-fragmenter fra 0,00037 til 0,60, med et gennemsnit på 0,031 (Additional file 2: Figur S1, nederste panel). I alt er 43,94 % og 54,61 % af de formodede introgresserede fragmenter i G. soja- og G. max-subpopulationerne fælles for to eller flere accessioner, og de resterende er accessionsspecifikke (Yderligere fil 2: Figur S2). Ingen af de putative introgresserede fragmenter, der blev påvist i denne undersøgelse, var fuldt fikseret i hverken G. soja- eller G. max-subpopulationerne (figur 2).

Figur 1
figur1

Phylogenetisk nabo-sammenføjningstræ af et panel af vilde og dyrkede sojabønner. Træet blev konstrueret på grundlag af genomdækkende SNP’er, der blev påvist ved genome resequencing ved hjælp af MEGA-programmet. Grene markeret med rødt og blåt angiver henholdsvis G. soja og G. max (landrace). Koderne for individuelle accessioner og fraktionen af introgresserede fragmenter er vist i træets yderste lag

Figur 2
figur2

Genome-wide distribution af interspecifik introgression og genomiske træk. Ringene i cirklen, fra ydersiden til indersiden, viser kromosomer, herunder (i) kromosomarme (grå farve) og pericentromeriske regioner (grøn farve), (ii) kromosomal fordeling af introgressionshastigheder i hele populationen, (iii) kromosomal fordeling af domesticeringsrelaterede QTL som angivet ved røde søjler i den tilsvarende ring, (iv) kromosomal fordeling af selektive sweeps som angivet ved røde søjler i den tilsvarende ring, (v) kromosomal fordeling af interspecifik introgression i hver af de 12 G. max og 10 G. soja-accessioner, som angivet ved de 22 ringe, hvis genomer hver har mere end 5 % introgresserede fragmenter. I disse 22 ringe er G. max-segmenterne vist med blå farve og G. soja-segmenterne med orange

Tidligere analyser af populationsstruktur og blanding i sojabønner har afsløret lokale genomiske regioner, der viser usædvanlige ligheder mellem G. soja og G. max (5, 7), hvilket blev anset for at være bevis for genomisk introgression. Den ovenfor beskrevne rIBD-analyse, der definerer de lokale genomiske regioner for de enkelte accessionsformer, der er involveret i den formodede introgression, giver yderligere beviser for introgression af G. soja-G. max. Der er dog fortsat en mulighed for, at nogle af de formodede introgressioner, især formodede G. soja-fragmenter, der er påvist i G. max-baggrunden, kan skyldes ufuldstændig sortering af forfædrenes polymorfismer i den kildepopulation, der blev anvendt i domesticeringsprocessen. I et forsøg på at indsamle yderligere beviser til støtte for hypotesen om introgression foretog vi en D-statistisk analyse for de store formodede G. max-introgressionsregioner, der blev påvist i de 8 G. soja-accessioner (Fig. 2), i parvis sammenligning med 10 tilfældigt udvalgte G. soja-moderfragmenter (Fig. 2). max-accessioner uden påvist introgression (fig. 1) og for de store formodede G. soja-introgressionsregioner, der er påvist i de 14 G. max-accessioner (fig. 2) i parvis sammenligning med 10 tilfældigt udvalgte G. soja-accessioner uden påvist introgression (fig. 1). Som det fremgår af fig. 3a, var D-statistikken for de regioner, der havde putativ introgression (D = – 0,15 ± 0,07), signifikant lavere end regionerne uden putativ introgression (D = – 0,08 ± 0,05) og var også signifikant lavere end gennemsnittet for hele genomet (D = – 0,11 ± 0,04), hvilket tyder på, at genstrømmen mellem G. soja- og G. max-taxaerne var involveret i disse genomiske regioner med påvist putativ introgression.

Figur 3
figur3

D-statistisk analyse afslører forskellige mønstre af genflow i forskellige regioner mellem G. soja og G. max. En D-statistisk analyse for store putative G. max-introgresserede regioner, der er påvist i de 8 G. soja-accessioner/store putative G. soja-introgresserede regioner, der er påvist i de 14 G. max-accessioner i parvis sammenligning med disse regioner i tilfældigt udvalgte 10 G. max-accessioner. max-accessioner/10 G. max-accessioner uden påvist interspecifik introgression versus regioner uden putativ introgression. b D-statistik for pericentromeriske regioner versus kromosomale arme i den parvise sammenligning mellem accessioner som beskrevet i a. Signifikante forskelle (p-værdier < 0.05) mellem sammenlignede regioner, som angivet med forskellige bogstaver i boxblots, blev påvist ved Kolmogorov-Smirnov-testen

I et forsøg på at spore oprindelsen af den påviste introgression sammenlignede vi store og repræsentative introgressionssegmenter i en G. soja accession (PI 578357, s61) og en landrace (PI 339734, m30), som blev anslået til at bære henholdsvis 33% og 31% introgressionsfragmenter, med tilsvarende regioner i andre accessioner. Genom-dækkende formodet introgression i en G. soja-tilslutning PI 578357 (s61), en af de G. soja-tilslutninger, der støder op til G. max-kladerne, blev eksemplificeret i Fig. 4b og Additional file 2: Figur S3.

Figur 4
figur4

Eksemplificering af introgression og formodet oprindelse af introgression illustreret ved relativ identisk ved afstamning (rIBD). a-c Genomisk komponent langs kromosom 2 i tre beslægtede accessionsnumre Heihexiaohuangdou, PI 578357 og PI 522226. En G. soja-tiltrædelse (b) bærer introgresserede G. max-fragmenter, der har den største lighed med de tilsvarende regioner i en landrace (a), og de G. soja-segmenter, der har den største lighed med de tilsvarende regioner i en G. soja-tiltrædelse (c). d Kladogramtræet baseret på SNP’er i introgressionsregionerne på kromosom 2, der viser G. max (Heihexiaohuangdou, blå) oprindelse af regionerne i G. max (Heihexiaohuangdou, blå). soja-accession PI 578357, som angivet med pilen. e Kladogramtræet baseret på SNP’er i ikkeintrogressionsregionerne, der viser G. soja (PI 522226, rød) oprindelse for regionerne i PI 578357, som angivet med pilen. f Geografisk fordeling af de tre beslægtede accessioner. g-i Genomisk komponent langs kromosom 19 i de tre beslægtede accessioner PI 548456, PI 339734 og PI 407275. En G. max-tiltrædelse (h) bærer introgresserede G. soja-fragmenter, der har den største lighed med de tilsvarende regioner i en G. soja-tiltrædelse (i), og de G. max-segmenter, der har den største lighed med de tilsvarende regioner i en G. max-tiltrædelse (g). j Kladogramtræet baseret på SNP’er i de ikke-introgressionsregioner, der viser G. max (PI 548456, blå) oprindelsen af regionerne i PI 339734, som angivet med pilen. k Kladogramtræet baseret på SNP’er i introgressionsregionerne på kromosom 2, der viser G. max (PI 548456, blå) oprindelsen af regionerne i PI 339734, som angivet med pilen. soja (PI 407275, rød) oprindelsen af regionerne i G. max accession PI 339734, som er markeret med pilen. l Geografisk fordeling af de tre beslægtede accessioner

Introgressionsregionerne i PI 578357 dækker hele den pericentromeriske region af kromosom 2 uden tidligere påviste domesticerings-QTL’er (Fig. 2) og blev derfor anset for at have undergået et minimalt selektivt pres for deres bevarelse. Vi fandt, at de undersøgte regioner af kromosom 2 i PI 578357, der er dyrket i Amur, Rusland, har den største sekvenslighed med de tilsvarende regioner i en landrace Heihexiaohuangdou (m104), der er dyrket i Heihe, Kina (Fig. 4a, b, d, f). Derimod har de ikke-introgressionsregioner i PI 578357 den største lighed med de tilsvarende regioner i en G. soja-accession PI 522226 (s5) dyrket i Primorye, Rusland (Fig. 4b, c, e, f), som er en af de G. soja-accessioner, der er mest divergerende fra PI 578357 og fra G. max-linjen (Fig. 1), og som derfor sandsynligvis ikke er involveret i eller stammer fra den kildepopulation, der blev anvendt til domesticering af sojabønne. Introgressionsregionerne på kromosom 19 i PI 339734, en landrace dyrket i Korea, viste sig at have den største sekvenslighed med de tilsvarende regioner i en G. soja accession PI 407275 (s42), som også blev dyrket i Korea (Fig. 4h, i, k, l). Derimod er der størst lighed mellem de regioner i PI 339734, der ikke er indtrængningsregioner, og de tilsvarende regioner i en landrace PI 548456 (m111), der også blev dyrket i Pyongyang, Nordkorea (fig. 4g, h, j, l). Den geografiske fordeling, mønstrene og niveauerne af sekvenslighed og divergens mellem lokale genomiske regioner og den samlede genom-dækkende sekvensdiversitet og fylogeni for disse accessioner tyder tilsammen på, at den påviste kimerisme af kromosomer, som beskrevet ovenfor, højst sandsynligt skyldes interspecifik introgression i stedet for ufuldstændig sortering af forfædres polymorfismer i kildepopulationen for domesticering af sojabønne. På grundlag af gensekvenser i hele genomet blev divergenstidspunkterne mellem PI 578357 og Heihexiaohuangdou og mellem PI 339734 og PI 407275 dateret til henholdsvis ~ 0,37 og 0,27 millioner år siden (mya). Da domesticeringen af sojabønner kun fandt sted for ~ 6000-9000 år siden, bør en så høj grad af lighed mellem de undersøgte introgressionsregioner mellem de to par af (G. soja-G. max)-accessioner, som er eksemplificeret ovenfor, betragtes som et direkte bevis på introgression af G. soja-G. max.

Faktorer, der former landskabet af G. soja-G. max-introgressioner, bør betragtes som direkte beviser for introgression af G. soja-G. max-introgression.

max introgression

For at forstå de evolutionære kræfter, der former fordelingen af genomisk introgression i de to subpopulationer, sammenlignede vi først de gennemsnitlige andele af introgresserede fragmenter mellem pericentromeriske regioner og kromosomale arme, der var groft defineret på grundlag af hastighederne for lokal genetisk rekombination og fysiske positioner af centromerberigede gentagelser i sojabønne-genomet . Generelt udviser pericentromeriske regioner stærkt reducerede hastigheder for genetisk rekombination og skæv akkumulation af skadelige mutationer som f.eks. indsættelse af transposable elementer sammenlignet med kromosomale arme . Vi fandt, at på trods af nogle undtagelser, har de pericentromeriske regioner generelt højere andele af introgresserede fragmenter i enten G. soja-subpopulationen eller G. max-subpopulationen (parret Student t-test, p-værdi < 0,01, Fig. 2 og Additional file 3: Table S2). D-statistisk analyse for pericentromeriske regioner i sammenligning med arme blev udført ved hjælp af den samme delmængde af G. max- og G. soja-accessioner. Som vist i Fig. 3b var D-statistikken for de pericentromeriske regioner (D = – 0,12 ± 0,06) signifikant lavere end kromosomarmene (D = – 0,09 ± 0,02) (Fig. 3b), hvilket tyder på en skæv ophobning af genstrømmen i pericentromeriske regioner. En sådan skævhed kan delvis være resultatet af de reducerede hastigheder for genetisk rekombination og dermed reduceret effektivitet i udrensning af introgresseret variation/fragmenter i pericentromeriske regioner sammenlignet med kromosomale arme.

Theoretisk set var genomisk introgression resultatet af spontan hybridisering og efterfølgende tilbagekrydsning, der involverede G. soja og G. max skulle have været underkastet to forskellige selektionstryk: naturlig selektion for de vilde egenskaber i retning af dannelse af G. soja eller G. soja-lignende accessionsformer, der er tilpasset naturlige miljøer, versus kunstig selektion for dyrkede egenskaber i retning af udvikling af G. max eller G. max-lignende accessionsformer, der er egnede til dyrkning. Hvis dette er tilfældet, vil vi forvente at observere forskellige mønstre for fordelingen af introgresserede fragmenter mellem G. soja og G. max underpopulationer. For at teste denne hypotese estimerede vi først andelen af introgresserede fragmenter i 122 selektive sweeps (Fig. 2), der udviste alvorlige reduktioner af nukleotidvariation fra G. soja-subpopulationen til G. max-subpopulationen . Disse regioner i dyrkede sojabønner var sandsynligvis et resultat af et stærkt selektivt pres, der virker på bestemte loci, der er forbundet med domesticering af sojabønner . Som forventet blev der i G. soja-tilslutningerne påvist en signifikant lavere andel af G. max-fragmenter i de regioner, der svarer til de selektive sweep-regioner, sammenlignet med den resterende del af genomet (parret Student t-test, p-værdi = 0,002667, Fig. 5a). Derimod blev der påvist en signifikant lavere andel af G. soja-fragmenter i de selektive sweep-regioner i sammenligning med den resterende del af genomet i G. max-accessionerne (parret Student t-test, p-værdi = 2,542e-09, fig. 5c).

Fig. 5
Figur5

Mønstre for naturlig selektion og kunstig selektion mod genomisk introgression. a Proportioner af introgresserede G. max-fragmenter i selektive sweep-regioner sammenlignet med dem i hele genomet, der er påvist i de G. soja-subpopulationen. b Andelen af introgresserede G. max-fragmenter i domesticeringsrelaterede QTL-regioner sammenlignet med dem i hele genomet, der er påvist i G. soja-subpopulationen. c Andelen af introgresserede G. soja-fragmenter i selektive sweep-regioner sammenlignet med dem i hele genomet, der er påvist i G. max-subpopulationen. d Andelen af introgresserede G. soja-fragmenter i domesticeringsrelaterede QTL-regioner sammenlignet med dem i hele genomet, der er påvist i G. max-subpopulationen. Signifikant forskel i hver sammenligning blev beregnet ved hjælp af parret Student t-test. ***p < 0,001

Dertil kommer, at vi estimerede andelene af introgresserede fragmenter i 44 QTL-regioner, der ligger til grund for domesticering af sojabønner (Fig. 2). Disse QTL’er er for nylig blevet identificeret ved hjælp af ca. 800 rekombinante indavlslinjer (RIL), der stammer fra krydsninger mellem Williams 82 og hver af 2 G. soja-accessioner PI 468916 (s14) og PI 479752 (s15) . Vi fandt, at andelen af introgresserede fragmenter i de tilsvarende domesticerings-QTL-regioner af enten G. max- eller G. soja-accessionerne er endnu mindre end detekteret i de selektive sweep-regioner (Fig. 5b, d). Tilsammen tyder disse observationer på forskellige resultater og virkninger af tovejs selektion, dvs, naturlig udvælgelse versus kunstig udvælgelse, på tilbageholdelsen af introgresserede fragmenter i G. soja- og G. max-subpopulationerne.

Introgressionsmedieret genstrøm omkring vigtige domesticeringsgener

Genomisk introgression er blevet realiseret som en vigtig vej for genstrøm; vi spekulerede på, hvordan genstrøm kan have påvirket domesticeringsprocessen og den genetiske arkitektur af sojabønne-genomet på populationsniveau. For nylig er der blevet isoleret to vigtige gener til domesticering af sojabønner GmHs1-1 og Bloom1 (B1), som kontrollerer henholdsvis frøhårdhed og frøskjoldblomstring . Frøskjoldets uigennemtrængelighed og blomstring blev anset for at være vigtige eller afgørende for den langsigtede overlevelse af vilde sojabønner, mens et gennemtrængeligt frøskjold uden blomstring var ønskeligt for landbrugsproduktion og menneskeføde og målrettet for udvælgelse under domesticering. Den forårsagende mutation på hver af de to loci for den vigtigste overgang til domesticering blev identificeret og funktionelt valideret . En recessiv mutation (C→T) i den kodende region af GmHs1-1 resulterede i overgangen fra uigennemtrængelig frøkappe i vild sojabønne til gennemtrængelig frøkappe i dyrket sojabønne, og udvælgelse for den domesticerede allel Gmhs1-1 dannede et ~ 160-kb selektivt sweepområde . En recessiv mutation (C→T) i kodningsområdet for B1 var ansvarlig for tabet af frøskjoldets blomstring i de dyrkede sojabønner, og udvælgelse af den domesticerede allel b1 resulterede i et ~ 301-kb selektivt fejningsområde . Så vidt vi ved, er dette de eneste to gener, der er identificeret til dato, hvis to alleler næsten udelukkende kan skelne de vilde sojabønner fra de dyrkede sojabønner, og i mellemtiden deles den identiske kausale mutation på hver af de to loci for de domesticerede fænotyper med de dyrkede sojabønner.

Ved hjælp af SNP’er i de to selektive sweep-regioner, der omgiver GmHS1-1/Gmhs1-1- og B1/b1-loci, konstruerede vi de fylogenetiske relationer mellem de 62 G. soja-accessioner og 129 landracer. Den formodede introgression, der involverer de to selektive sweep-regioner, blev defineret ved hjælp af de fylogenetiske relationer. I GmHs1-1/Gmhs1-1-regionen på ~ 160 kb blev det afsløret, at 13 landracer havde G. soja-lignende GmHs1-1-region, mens kun 1 G. soja-tilslutning, PI 366121 (s58), viste sig at have G. max-lignende Gmhs1-1-region (Fig. 6a). De G. soja-lignende GmHs1-1-regioner, der blev fundet i de 13 landracer, var spredt i alle hovedkladerne i G. soja-populationen (Fig. 6a), mens kun en delmængde af kladerne af GmHs1-1-regionerne kan være kilden til selektion for Gmhs1-1-allelen under domesticeringen. De forskellige GmHs1-1-regioner i disse landracer var således mere sandsynligt et resultat af interspecifik introgression. I den ~ 301-kb B1/b1-region viste PI 339734 sig at være den eneste landrace, der besidder den G. soja-lignende B1-region, mens PI 549046 (s28) viste sig at være den eneste G. soja-tilslutning, der indeholder den G. max-lignende b1-region (Fig. 6b), som er næsten identisk med den af en G. max-sort PI 437654 (m47) (Fig. 6b). Denne G. soja-tilslutning blev fylogenetisk grupperet på hele genomniveau i en klade, der ligger langt fra andre G. soja-klasser, der støder op til G. max (Fig. 1), hvilket tyder på, at b1-regionen i denne G. soja-tilslutning sandsynligvis er opstået fra G. max gennem genstrøm. Blandt disse landracer er PI 339734 den eneste accession, der behandler både GmHs1-1- og B1-regionen (Fig. 6a, b).

Fig. 6
figure6

Fylogenetiske relationer blandt de 191 accessioner afsløret ved sammenligning med to selektive sweep-regioner. a GmHs1-1-regionen og b B1-regionen. Asteriskerne markerer G. soja- og G. max-accessioner, der indeholder introgresserede fragmenter fra henholdsvis G. max og G. soja

Selektive sweeps omkring domesticerings-QTL kan generelt påvises på populationsniveau, men grænserne for specifikke haplotyper under selektion inden for en bestemt selektiv sweep-region varierer mellem de enkelte accessioner. For yderligere at spore sporene af genstrømme, der involverer disse centrale domesticeringsloki, zoomede vi ind på de to domesticeringsgener og deres tilstødende sekvenser, herunder de respektive formodede promoter- og terminatorsekvenser, med fokus på den forårsagende mutation, der resulterede i domesticeringsallelen på hvert lokus. På GmHs1-1/Gmhs1-1 locus blev 13 landracer fundet at dele G. soja eller G. soja-lignende haplotyper, herunder det GmHs1-1-specifikke nukleotid (C), mens 7 G. soja-accessioner blev fundet at besidde G. max eller G. max-lignende haplotypen, herunder Gmhs1-1-specifikt nukleotid (T) (Fig. 6a og Additional file 2: Figur S4). I overensstemmelse med fylogenien af B1/b1-sugeområderne blandt de 191 accessioner (Fig. 6b), var G. soja PI 549046 (s28) viste sig at besidde b1 haplotypen, herunder den kausale mutation (T) for b1, som er identisk med den af 191 landracer, mens haplotypen af landrace PI 339734 (m30) er meget identisk med dem af størstedelen af G. soja-accessionerne, herunder B1-specifik nukleotid (C) (Additional file 2: Figur S5). I betragtning af den fylogenetiske skelnen mellem G. soja- og G. max-subpopulationerne vil den påviste blanding af de selektive sweep-regioner og haplotyper ved de to domesticeringsgenloci i den undersøgte population blive betragtet som et yderligere bevis på genstrøm mellem subpopulationerne.

Introgression afsløret ved asymmetrisk diversifikation mellem det nukleare og organellære genom

I betragtning af, at krydsninger mellem G. soja og G. max let kan foretages for at producere fertile frø, blev den påviste introgression eller genstrøm i denne undersøgelse som beskrevet ovenfor anset for at være levn fra runder af spontan hybridisering, der involverer disse to genpuljer gennem pollenspredning og/eller frøspredning. I teorien ville nogle af hybridiseringsbegivenhederne kunne påvises ved sammenligning med deres organellære genomer i sammenhæng med den genetiske arkitektur, der er defineret af deres nukleare genomer. Vi analyserede således kloroplastgenomsekvenserne af de 191 re-sekventerede sojabønneaccessioner . Blandt de 191 kloroplastgenomer blev i alt 333 meget nøjagtige SNP’er identificeret og derefter brugt til at konstruere det fylogenetiske træ (Fig. 7). Samlet set blev de 191 kloroplastgenomer grupperet i 2 undergrupper, G. max-undergruppen og G. soja-undergruppen. Som forventet er kloroplastgenomerne af G. max-tilslutningerne inden for G. max-undergruppen mindre divergerende end kloroplastgenomerne af G. soja-tilslutningerne inden for G. soja-undergruppen. På trods af den klare adskillelse af kloroplastgenomerne mellem G. max- og G. soja-undergrupperne blev 24 G. max-accessioner grupperet i G. soja-undergruppen, og 3 G. soja-accessioner blev grupperet i G. max-undergruppen (fig. 7). Disse observationer tyder på, at der forekommer G. soja-G. max-hybridiseringsbegivenheder med enten G. soja eller G. max som moderforælder. Sådanne hændelser har tilsyneladende omformet den genetiske arkitektur af kernegenomerne i både G. soja- og G. max-subpopulationerne.

Figur 7
figur7

Asymmetrisk divergens af kerne- og kloroplastgenomerne mellem G. max- og G. soja-accessioner. Det fylogenetiske træ af kernegenomerne af de 191 accessions blev konstrueret ved hjælp af alle SNP’er, der blev påvist i hele genomet, mens det fylogenetiske træ af kloroplasten af det samme sæt accessions blev konstrueret ved hjælp af 333 meget sikre SNP’er fordelt over kloroplastgenomet. G. max-accessionerne blev angivet ved blå grene af 2 træer og markeret med blå prikker, mens G. soja-accessionerne blev angivet ved røde grene af 2 træer og markeret med røde prikker. De samme accessioner i de to træer var forbundet med linjer. Blå linjer angiver G. max-accessioner, der besidder kloroplaster af G. soja-typen, orange linjer angiver G. soja-accessioner, der besidder kloroplaster af G. max-typen, og grå linjer angiver G. soja- og G. max-accessioner, der besidder henholdsvis G. soja- og G. max-typer af kloroplaster

For de G. max- og G. soja-accessioner, der besidder respektive G. max- og G. soja-kloroplaster, har mere nært beslægtede accessioner i henhold til deres kernegenomer tendens til at dele identiske eller mere lignende haplotyper af deres kloroplastgenomer (Fig. 7 og Additional file 2: Figur S6), hvilket tyder på co-evolution mellem kernegenomerne og kloroplastgenomerne som et generelt mønster. Der blev dog også observeret tydelige undtagelser. F.eks. blev det konstateret, at nogle accessioner med stærkt divergerende kernegenomer havde identiske eller næsten identiske haplotyper af kloroplastgenomer, og nogle accessioner med mere nært beslægtede kernegenomer havde mere divergerende haplotyper af kloroplastgenomer (Additional file 2: Figur S6). Sådanne undtagelser tyder på, at der også har fundet hybridiseringsbegivenheder sted mellem meget divergerende accessioner med hensyn til deres nukleare genomer inden for G. max-subpopulationen eller inden for G. soja-subpopulationen, og sådanne begivenheder er meget sandsynligt ansvarlige for den observerede uovertrufne sortsdiversificering mellem de nukleare og kloroplastgenomer.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.