Genomisk introgression genom interspecifik hybridisering motverkar genetisk flaskhals under domesticering av sojabönor

Genomövergripande identifiering av putativa G. soja-G. max introgression

För att undersöka introgression över hela genomet mellan odlade och vilda sojabönor har vi analyserat data från en representativ sojabönspopulation som omfattar 62 G. soja accessioner, 130 lantraser och 110 förbättrade sojabönsodlingar som samlats in från olika ekogeografiska regioner i Kina och från andra länder, inklusive Korea, Japan, Ryssland, USA och Kanada. Dessa prover var fördelade på nästan alla större fylogenetiska klasser/grupper av 18 480 domesticerade accessioner av sojabönor och 1168 vilda accessioner av sojabönor som samlats in från 84 länder eller utvecklats i USA och som är deponerade i US Department of Agriculture (USDA) Soybean Germplasm Collection och därmed anses vara mycket representativa för den genetiska mångfalden av sojabönor. Vi identifierade först lokala regionala haplotyper i var och en av de 62 G. soja- och 240 G. max-accessionerna som var identiska genom härstamning (IBD) med individer inom G. soja- och G. max-subpopulationerna med hjälp av alla SNP-data från de 302 accessionerna enligt en metod som tidigare beskrivits . För att beräkna frekvensen av de delade haplotyperna i olika regioner längs varje kromosom i sojabönsgenomet delade vi upp varje kromosom i bins på 10 kb och beräknade antalet registrerade IBD-trakter mellan varje accession och de två G. soja- och G. max-subpopulationerna per bin genom parvisa jämförelser. Dessa antal normaliserades från 0 (ingen IBD upptäcktes) till 1 (IBD delas av alla individer inom en subpopulation), och den normaliserade IBD mellan varje accession och G. soja-subpopulationen (nIBDG. soja) och mellan varje accession och G. max-subpopulationen (nIBDG. max) användes för att beräkna den relativa IBD (rIBD) mellan de jämförda grupperna (rIBD = nIBDG. soja – nIBDG. max). Slutligen identifierades den förmodade genomiska introgressionen från G. soja-subpopulationen till var och en av de odlade sojabönsaccessionerna och från G. max-subpopulationen till var och en av de vilda sojabönsaccessionerna.

Med hjälp av detta tillvägagångssätt upptäcktes 297 av 302 accessioner som innehöll förmodad interspecifik introgression (Additional file 1: Table S1, Additional file 2: Figure S1). De 110 elitsorterna uteslöts från ytterligare analyser eftersom dessa sorter uppvisade relativt mindre introgression från den vilda sojabönan (0,00015~0,03) och eftersom utvecklingen av dessa sorter innefattade mänskligt framkallad hybridisering som skulle kunna dölja naturligt förekommande introgressionshändelser. En lantsort uteslöts också från vidare analyser på grund av dess relativt låga kvalitet på de genomiska sekvenserna och den höga nivån av heterozygositet. Bland de återstående accessionerna, inklusive 62 accessioner av G. soja och 129 landraser, varierar andelen upptäckta introgresserade fragment i enskilda genomer från 0,00037 till 0,60, med ett genomsnitt på 0,032 (fig. 1, Additional file 1: Table S1). Den kromosomala fördelningen av den upptäckta introgressionen i accessioner med > 0,05 (5 %) introgresserade fragment i enskilda genomer (Additional file 1: Table S1) illustreras i fig. 2. Bland G. soja-genomerna varierar andelen upptäckta G. max-fragment från 0,00059 till 0,41, med ett genomsnitt på 0,019 (Additional file 2: Figur S1, övre panelen). Bland G. max-genomerna varierar andelen upptäckta G. soja-fragment från 0,00037 till 0,60, med ett genomsnitt på 0,031 (Additional file 2: Figur S1, nedre panel). Totalt delas 43,94 % och 54,61 % av de förmodade introgresserade fragmenten i G. soja- och G. max-subpopulationerna av två eller flera accessioner, och de återstående är accessionsspecifika (Additional file 2: Figur S2). Inget av de putativa introgresserade fragmenten som upptäcktes i den här studien var helt fixerat i vare sig G. soja- eller G. max-subpopulationerna (figur 2).

Fig. 1
figure1

Fylogenetiskt grannsamverkansträd av en panel av vilda och odlade sojabönor. Trädet konstruerades baserat på SNP:er i hela genomet som upptäcktes genom omsekvensering av genomet med hjälp av MEGA-programmet. Grenar märkta med rött och blått anger G. soja respektive G. max (lantras). Koderna för enskilda accessioner och fraktionen av introgresserade fragment visas i trädets yttre lager

Fig. 2
figure2

Genomövergripande fördelning av interspecifik introgression och genomiska egenskaper. Ringarna i cirkeln, från utsidan till insidan, visar kromosomer inklusive i) kromosomarmar (grå färg) och pericentromeriska regioner (grön färg), ii) kromosomal fördelning av introgressionshastigheter i hela populationen, iii) kromosomal fördelning av domesticeringsrelaterade QTL som anges av röda staplar i motsvarande ring, iv) kromosomal fördelning av selektiva svep som anges av röda staplar i motsvarande ring, v) kromosomal fördelning av interspecifik introgression i var och en av de 12 G. max och 10 G. soja-tillgångar, enligt de 22 ringarna, vars genom var och en har mer än 5 % introgresserade fragment. I dessa 22 ringar visas G. max-segmenten i blått och G. soja-segmenten i orange

Förra analyser av populationsstruktur och blandning i sojabönor har avslöjat lokala genomiska regioner som uppvisar exceptionella likheter mellan G. soja och G. max (5, 7), vilket ansågs vara ett bevis för genomisk introgression. Den rIBD-analys som definierar de lokala genomiska regionerna för enskilda accessioner som är involverade i den förmodade introgressionen som beskrivs ovan ger ytterligare bevis till stöd för introgressionen mellan G. soja och G. max. Det finns dock fortfarande en möjlighet att en del av den förmodade introgressionen, särskilt förmodade G. soja-fragment som upptäckts i G. max-bakgrunden, kan bero på ofullständig sortering av existerande polymorfismer från förfäderna i den källpopulation som använts i domesticeringsprocessen. I ett försök att samla ytterligare bevis för att stödja hypotesen om introgression utförde vi en D-statistisk analys för de stora förmodade G. max-introgresserade regionerna som upptäcktes i de åtta G. soja-tillgångarna (fig. 2) i en parvis jämförelse med tio slumpmässigt utvalda G. max-tillgångar (fig. 2). max-accessioner utan upptäckt introgression (fig. 1) och för de stora förmodade G. soja-introgresserade regionerna som upptäcktes i de 14 G. max-accessionerna (fig. 2) i parvis jämförelse med 10 slumpmässigt utvalda G. soja-accessioner utan upptäckt introgression (fig. 1). Som framgår av figur 3a var D-statistiken för de regioner som innehöll förmodad introgression (D = – 0,15 ± 0,07) betydligt lägre än regionerna utan förmodad introgression (D = – 0,08 ± 0,05) och var också betydligt lägre än genomsnittet för hela genomet (D = – 0,11 ± 0,04), vilket tyder på att genflödet mellan G. soja- och G. max-taxa var inblandat i dessa genomiska regioner med upptäckt förmodad introgression.

Figur 3
figur3

D-statistisk analys avslöjar distinkta mönster av genflöde i olika regioner mellan G. soja och G. max. en D-statistisk för stora putativa G. max-introgresserade regioner som upptäckts i de 8 G. soja-tilläggen/stor putativ G. soja-introgresserade regioner som upptäckts i de 14 G. max-tilläggen i parvis jämförelse med dessa regioner i slumpmässigt utvalda 10 G. max-tilläggen. max accessioner/10 G. max accessioner utan upptäckt interspecifik introgression jämfört med regioner utan förmodad introgression. b D-statistik för pericentromeriska regioner jämfört med kromosomala armar i den parvisa jämförelsen mellan accessioner enligt beskrivningen i a. Signifikanta skillnader (p-värden < 0.05) mellan jämförda regioner, som anges med olika bokstäver i boxblots, upptäcktes med Kolmogorov-Smirnov-testet

I ett försök att spåra ursprunget till den upptäckta introgressionen jämförde vi stora och representativa introgressionssegment i en G. soja accession (PI 578357, s61) och en lantras (PI 339734, m30), som uppskattades bära 33 % respektive 31 % introgresserade fragment, med motsvarande regioner i andra accessioner. Genombreddande förmodad introgression i en G. soja accession PI 578357 (s61), en av de G. soja accessioner som gränsar till G. max-kladerna, exemplifierades i Fig. 4b och Additional file 2: Figur S3.

Fig. 4
figur4

Exempel på introgression och förmodat ursprung för introgression illustrerat med relativ identisk genom nedstigning (rIBD). a-c Genomisk komponent längs kromosom 2 i tre besläktade accessioner Heihexiaohuangdou, PI 578357 och PI 522226. En G. soja-accession (b) bär introgresserade G. max-fragment som har störst likhet med motsvarande regioner i en lantras (a), och G. soja-segmenten som har störst likhet med motsvarande regioner i en G. soja-accession (c). d Kladogramträdet baserat på SNP:er i introgressionsregionerna på kromosom 2, som visar att regionerna i G. max (Heihexiaohuangdou, blått) har sitt ursprung i G. max (Heihexiaohuangdou, blått) och att regionerna i G. soja har sitt ursprung i G. max (Heihexiaohuangdou, blått). soja accession PI 578357, vilket framgår av pilen. e Kladogramträdet baserat på SNP:er i de regioner som inte är introgressionsområden som visar att regionerna i PI 578357 har sitt ursprung i G. soja (PI 522226, rött), vilket framgår av pilen. f Geografisk fördelning av de tre besläktade accessionerna. g-i Genomisk komponent längs kromosom 19 i de tre besläktade accessionerna PI 548456, PI 339734 och PI 407275. En G. max accession (h) bär introgresserade G. soja-fragment som har störst likhet med motsvarande regioner i en G. soja accession (i) och de G. max-segment som har störst likhet med motsvarande regioner i en G. max accession (g). j Trädet i kladogrammet baserat på SNPs i de regioner som inte är introgressionsområden som visar att regionerna i PI 339734 har sitt ursprung i G. max (PI 548456, blått), vilket visas med pilen. k Trädet i kladogrammet baserat på SNPs i introgressionsområdena på kromosom 2 som visar att regionerna i PI 339734 har sitt ursprung i G. max (PI 548456, blått), vilket visas med pilen. soja (PI 407275, röd) ursprunget till regionerna i G. max accession PI 339734, som pekas ut av pilen. l Geografisk fördelning av de tre besläktade accessionerna

Introgressionsregionerna i PI 578357 sträcker sig över hela den pericentromeriska regionen av kromosom 2 utan tidigare upptäckta domesticerings-QTL:er (Fig. 2) och ansågs därför ha genomgått ett minimalt selektionstryck för att behålla dem. Vi fann att de undersökta regionerna av kromosom 2 i PI 578357, odlad i Amur, Ryssland, har den största sekvenslikheten med motsvarande regioner i en lantras Heihexiaohuangdou (m104) odlad i Heihe, Kina (fig. 4a, b, d, f). Däremot har de regioner som inte är introgressionsregioner i PI 578357 störst likhet med motsvarande regioner i en G. soja accession PI 522226 (s5) som odlats i Primorye, Ryssland (Fig. 4b, c, e, f), som är en av de G. soja accessioner som avviker mest från PI 578357 och från G. max linjen (Fig. 1), och därför är det osannolikt att den är involverad i eller härstammar från den källpopulation som använts för domesticering av sojabönor. Introgressionsregionerna på kromosom 19 i PI 339734, en lantras som odlas i Korea, visade sig ha störst sekvenslikhet med motsvarande regioner i en G. soja accession PI 407275 (s42) som också odlades i Korea (Fig. 4h, i, k, l). Däremot har de regioner som inte är introgressioner i PI 339734 störst likhet med motsvarande regioner i en lantras PI 548456 (m111) som också odlades i Pyongyang, Nordkorea (fig. 4g, h, j, l). Den geografiska spridningen, mönstren och nivåerna av sekvenslikhet och divergens i lokala genomiska regioner, och hela den genomomfattande sekvensdiversiteten och fylogenin för dessa accessioner tyder tillsammans på att den upptäckta chimärismen hos kromosomerna, som beskrivs ovan, troligen berodde på interspecifik introgression i stället för ofullständig sortering av förfädernas polymorfismer i källpopulationen för domesticering av sojabönor. Baserat på gensekvenser i hela genomet daterades divergenstiderna mellan PI 578357 och Heihexiaohuangdou och mellan PI 339734 och PI 407275 till ~ 0,37 respektive 0,27 miljoner år sedan (mya). Eftersom domesticeringen av sojabönor skedde för endast ~ 6000-9000 år sedan bör en sådan hög nivå av likheter i de undersökta introgressionsområdena mellan de två paren av (G. soja-G. max)-accessioner som exemplifieras ovan betraktas som ett direkt bevis på introgression av G. soja-G. max.

Faktorer som formar landskapet av G. soja-G. max-tillväxten i G. soja-G. max-tillväxten är en av de viktigaste faktorerna för att skapa en ny generation av sojabönor. max introgression

För att förstå de evolutionära krafter som formar fördelningen av genomisk introgression i de två subpopulationerna jämförde vi först de genomsnittliga andelarna introgresserade fragment mellan pericentromeriska regioner och kromosomala armar som grovt definierades baserat på hastigheterna för lokal genetisk rekombination och fysiska positioner av centromerberikade upprepningar i sojabönans genom . I allmänhet uppvisar pericentromeriska regioner kraftigt reducerade hastigheter för genetisk rekombination och förskjuten ackumulering av skadliga mutationer, t.ex. införande av transposerbara element, jämfört med kromosomala armar . Vi fann att de pericentromeriska regionerna, trots vissa undantag, överlag har högre andel introgresserade fragment i antingen G. soja-subpopulationen eller G. max-subpopulationen (parat Student-t-test, p-värde < 0,01, Fig. 2 och Additional file 3: Table S2). D-statistisk analys för pericentromeriska regioner i jämförelse med armar utfördes med samma delmängd av G. max- och G. soja-accessioner. Som framgår av fig. 3b var D-statistiken för de pericentromeriska regionerna (D = – 0,12 ± 0,06) betydligt lägre än kromosomarmarna (D = – 0,09 ± 0,02) (fig. 3b), vilket tyder på en snedvriden ackumulering av genflöde i pericentromeriska regioner. En sådan bias kan delvis vara ett resultat av den minskade graden av genetisk rekombination och därmed minskad effektivitet i rensningen av introgresserad variation/fragment i pericentromeriska regioner jämfört med kromosomala armar.

Teoretiskt sett resulterade genomisk introgression från spontan hybridisering, och efterföljande återkorsning som involverade G. soja och G. max bör ha genomgått två olika selektionstryck: naturligt urval för de vilda egenskaperna mot bildandet av G. soja eller G. soja-liknande accessioner som anpassar sig till naturliga miljöer kontra artificiellt urval för odlade egenskaper mot utvecklingen av G. max eller G. max-liknande accessioner som lämpar sig för odling. Om så är fallet skulle vi förvänta oss att observera olika mönster i fördelningen av introgresserade fragment mellan G. soja och G. max subpopulationer. För att testa denna hypotes uppskattade vi först andelen introgresserade fragment i 122 selektiva svep (fig. 2) som uppvisade kraftiga minskningar av nukleotidvariationen från G. soja-subpopulationen till G. max-subpopulationen . Dessa regioner i odlade sojabönor var troligen resultatet av ett starkt selektivt tryck som verkade på särskilda loci i samband med domesticeringen av sojabönor . Som förväntat upptäcktes en betydligt lägre andel G. max-fragment i de regioner som motsvarar de selektiva svepregionerna i jämförelse med den återstående delen av genomet i G. soja-tillgångarna (parat Student t-test, p-värde = 0,002667, fig. 5a). Däremot upptäcktes en betydligt lägre andel G. soja-fragment i de selektiva svepregionerna jämfört med den återstående delen av genomet i G. max-tillgångarna (parat Student-test, p-värde = 2,542e-09, fig. 5c).

Fig. 5
figur5

Mönster för naturligt urval och artificiellt urval mot genomisk introgression. a Proportioner av introgresserade G. max-fragment i selektiva svepregioner jämfört med dem i hela genomet som upptäckts i G. max-accessionerna. soja-subpopulationen. b Andelen introgresserade G. max-fragment i domesticeringsrelaterade QTL-regioner jämfört med dem i hela genomet som upptäckts i G. soja-subpopulationen. c Andelen introgresserade G. soja-fragment i selektiva svepregioner jämfört med dem i hela genomet som upptäckts i G. max-subpopulationen. d Andelen introgresserade G. soja-fragment i domesticeringsrelaterade QTL-regioner jämfört med dem i hela genomet som upptäckts i G. max-subpopulationen. Signifikanta skillnader i varje jämförelse beräknades med hjälp av parat Student-t-test. ***p < 0,001

Därutöver uppskattade vi andelarna introgresserade fragment i 44 QTL-regioner som ligger till grund för domesticering av sojabönor (fig. 2). Dessa QTL:er har nyligen identifierats med hjälp av cirka 800 rekombinanta inavelslinjer (RIL) som härrör från korsningar mellan Williams 82 och var och en av 2 G. soja accessioner PI 468916 (s14) och PI 479752 (s15) . Vi fann att andelen introgresserade fragment i motsvarande domesticerings-QTL-regioner av antingen G. max- eller G. soja-accessionerna är ännu mindre än vad som upptäcktes i de selektiva svepregionerna (fig. 5b, d). Tillsammans tyder dessa observationer på olika resultat och effekter av dubbelriktad selektion, dvs, naturligt urval kontra artificiellt urval, på bibehållandet av introgresserade fragment i G. soja- och G. max-subpopulationerna.

Introgressionsmedierat genflöde kring viktiga domesticeringsgener

Genomisk introgression har insetts vara en viktig väg för genflöde; vi undrade hur genflödet kan ha påverkat domesticeringsprocessen och sojabönsgenomets genetiska arkitektur på populationsnivå. Nyligen har två viktiga gener för domesticering av sojabönor, GmHs1-1 och Bloom1 (B1), som kontrollerar fröhårdhet respektive fröskalets blomning, isolerats. Fröskalets ogenomtränglighet och blomning ansågs vara viktiga eller nödvändiga för den långsiktiga överlevnaden av vilda sojabönor, medan ett genomträngligt fröskal utan blomning var önskvärt för jordbruksproduktion och mänsklig konsumtion och var föremål för urval vid domesticering. Den avgörande mutationen vid var och en av de två loci för den viktigaste övergången till domesticering identifierades och validerades funktionellt . En recessiv mutation (C→T) i den kodande regionen för GmHs1-1 resulterade i övergången från ogenomträngligt fröskal i vild sojaböna till genomträngligt fröskal i odlad sojaböna, och urvalet för den domesticerade allelen Gmhs1-1 bildade ett selektivt svepområde på ~ 160 kb . En recessiv mutation (C→T) i kodningsregionen för B1 var ansvarig för förlusten av fröskalets blomning i odlade sojabönor, och urvalet av den domesticerade allelen b1 resulterade i ett selektivt svepområde på ~ 301 kb . Såvitt vi vet är detta de enda två gener som hittills har identifierats vars två alleler nästan uteslutande kan skilja vilda sojabönor från odlade sojabönor, och under tiden är den identiska orsaksmutationen vid var och en av de två loci för de domesticerade fenotyperna gemensam för de odlade sojabönorna.

Med hjälp av SNP:er i de två selektiva svepregioner som omger GmHS1-1/Gmhs1-1- och B1/b1-loci konstruerade vi de fylogenetiska relationerna mellan de 62 G. soja-tillgångarna och 129 landraser. Den förmodade introgressionen som involverade de två selektiva svepområdena definierades av de fylogenetiska relationerna. I GmHs1-1/Gmhs1-1-regionen på ~ 160 kb visade sig 13 landraser ha G. soja-liknande GmHs1-1-region, medan endast 1 G. soja-tillträde, PI 366121 (s58), visade sig ha G. max-liknande Gmhs1-1-region (fig. 6a). De G. soja-liknande GmHs1-1-regioner som hittades i de 13 lantraserna var utspridda i alla större klasser av G. soja-populationen (fig. 6a), medan endast en delmängd av kladerna av GmHs1-1-regionerna kan vara källan till selektion för Gmhs1-1-allelen under domesticeringen. De olika GmHs1-1-regionerna i dessa lantraser var således mer sannolikt ett resultat av interspecifik introgression. I den ~ 301 kb stora B1/b1-regionen visade sig PI 339734 vara den enda lantrasen som hade den G. soja-liknande B1-regionen, medan PI 549046 (s28) visade sig vara den enda G. soja-anslutningen som innehöll den G. max-liknande b1-regionen (fig. 6b), som är nästan identisk med den i en G. max-sort PI 437654 (m47) (fig. 6b). Detta G. soja-tillträde var fylogenetiskt grupperat, på hela genomnivån, i en klad som ligger långt ifrån andra G. soja-klader som gränsar till G. max (fig. 1), vilket tyder på att b1-regionen i detta G. soja-tillträde troligen har uppstått från G. max genom genflöde. Bland dessa landraser är PI 339734 den enda accession som bearbetar både GmHs1-1- och B1-regionerna (fig. 6a, b).

Fig. 6
fig. 6

Fygenogenetiska relationer mellan de 191 accessionerna avslöjade genom jämförelse med två selektiva svepregioner. a GmHs1-1-regionen och b B1-regionen. Asterisker markerar G. soja- och G. max-accessioner som innehåller introgresserade fragment från G. max respektive G. soja

Selektiva svep som omger domesticerings-QTL kan i allmänhet upptäckas på populationsnivå, men gränserna för specifika haplotyper som är föremål för selektion inom ett visst selektivt svepområde varierar mellan enskilda accessioner. För att ytterligare spåra spåren av genflödet som involverar dessa viktiga domesticeringsloci zoomade vi in på de två domesticeringsgenerna och deras intilliggande sekvenser, inklusive respektive förmodade promotor- och terminatorsekvenser, med fokus på den orsakande mutationen som resulterade i domesticeringsallelen vid varje locus. Vid GmHs1-1/Gmhs1-1-lokuset visade sig 13 landraser dela G. soja- eller G. soja-liknande haplotyper inklusive GmHs1-1-specifik nukleotid (C), medan 7 G. soja-accessioner visade sig ha G. max- eller G. max-liknande haplotyper inklusive Gmhs1-1-specifik nukleotid (T) (Fig. 6a och Additional file 2: Figur S4). I överensstämmelse med fylogenin för B1/b1-svepregionerna bland de 191 accessionerna (fig. 6b), var G. soja PI 549046 (s28) visade sig ha b1 haplotypen, inklusive den kausala mutationen (T) för b1, som är identisk med den hos 191 lantraser, medan haplotypen hos lantrasen PI 339734 (m30) i hög grad är identisk med den hos majoriteten av G. soja-tillgångarna, inklusive B1-specifik nukleotid (C) (Additional file 2: Figur S5). Med tanke på den fylogenetiska distinktionen mellan subpopulationerna G. soja och G. max skulle den upptäckta blandningen av de selektiva svepregionerna och haplotyperna vid de två domesticeringsgenerna i den undersökta populationen betraktas som ytterligare bevis för genflöde mellan subpopulationerna.

Introgression avslöjad genom asymmetrisk diversifiering mellan kärngenom och organellärgenom

Med tanke på att korsningar mellan G. soja och G. max lätt kan göras för att producera fertila frön, ansågs den upptäckta introgressionen eller genflödet i den här studien, som beskrivits ovan, vara kvarlevor av rundor av spontan hybridisering som involverar dessa två genpooler genom pollenspridning och/eller fröspridning. I teorin skulle en del av hybridiseringshändelserna kunna upptäckas genom jämförelse med deras organellära genomer i samband med den genetiska arkitektur som definieras av deras nukleära genomer. Vi analyserade därför kloroplastgenomsekvenserna av de 191 omsekvenserade accessionerna av sojabönor . Bland de 191 kloroplastgenomerna identifierades totalt 333 mycket exakta SNP:er som sedan användes för att konstruera det fylogenetiska trädet (fig. 7). Totalt sett klustrades de 191 kloroplastgenomenen i två undergrupper, G. max-undergruppen och G. soja-undergruppen. Som förväntat är kloroplastgenomerna hos G. max-tillväxterna inom G. max-undergruppen mindre divergerande än kloroplastgenomerna hos G. soja-tillväxterna inom G. soja-undergruppen. Trots den tydliga skillnaden mellan kloroplastgenomerna i undergrupperna G. max och G. soja, klustrades 24 accessioner av G. max i undergruppen G. soja och 3 accessioner av G. soja i undergruppen G. max (fig. 7). Dessa observationer tyder på förekomsten av hybridiseringshändelser mellan G. soja och G. max med antingen G. soja eller G. max som moderförälder. Sådana händelser har uppenbarligen omformat den genetiska arkitekturen hos kärngenomerna i både G. soja- och G. max-subpopulationerna.

Fig. 7
figure7

Asymmetrisk divergens mellan kärn- och kloroplastgenomerna mellan G. max- och G. soja-ackcessioner. Det fylogenetiska trädet för kärngenomerna hos de 191 accessionerna konstruerades med hjälp av alla SNP:er som upptäcktes i hela genomet, medan det fylogenetiska trädet för kloroplasten hos samma uppsättning accessioner konstruerades med hjälp av 333 mycket säkra SNP:er fördelade över kloroplastgenomet. G. max-tillgångarna anges med blå grenar i två träd och markeras med blå prickar, medan G. soja-tillgångarna anges med röda grenar i två träd och markeras med röda prickar. Samma accessioner i de två träden var sammanlänkade med linjer. Blå linjer anger G. max-accessioner som har kloroplaster av G. soja-typ, orange linjer anger G. soja-accessioner som har kloroplaster av G. max-typ och grå linjer anger G. soja- och G. max-accessioner som har kloroplaster av G. soja- respektive G. max-typ

För G. max och G. soja som har respektive G. max- och G. soja-kloroplaster tenderar mer närbesläktade accessioner enligt deras kärngenom att dela identiska eller mer likartade haplotyper av deras kloroplastgenom (fig. 7 och Additional file 2: Figur S6), vilket tyder på samutveckling mellan kärngenom och kloroplastgenom som ett generellt mönster. Tydliga undantag observerades dock också. Till exempel upptäcktes vissa accessioner med mycket divergerande kärngenom att dela identiska eller nästan identiska haplotyper av kloroplastgenomen, och vissa accessioner med mer närbesläktade kärngenom upptäcktes att ha mer divergerande haplotyper av kloroplastgenom (Additional file 2: Figur S6). Sådana undantag tyder på att hybridiseringshändelser mellan mycket divergerande accessioner när det gäller deras kärngenom inom G. max-subpopulationen eller inom G. soja-subpopulationen också har inträffat, och det är mycket troligt att sådana händelser är ansvariga för den observerade oöverträffade sortdiversifieringen mellan kärn- och kloroplastgenomerna.

Lämna ett svar

Din e-postadress kommer inte publiceras.