L’introgression génomique par l’hybridation interspécifique contrecarre le goulot d’étranglement génétique pendant la domestication du soja

Identification à l’échelle du génome de l’introgression putative G. soja-G. max introgression

Pour étudier l’introgression à l’échelle du génome entre le soja cultivé et le soja sauvage, nous avons analysé les données de reséquençage du génome entier d’une population de soja représentative qui comprend 62 accessions de G. soja, 130 landraces et 110 cultivars de soja améliorés collectés dans diverses régions écogéographiques en Chine et dans d’autres pays, notamment la Corée, le Japon, la Russie, les États-Unis et le Canada . Ces échantillons étaient répartis dans presque tous les principaux clades/groupes phylogénétiques des 18 480 accessions de soja domestiqué et des 1168 accessions de soja sauvage collectées dans 84 pays ou développées aux États-Unis, qui sont déposées dans la Soybean Germplasm Collection du ministère américain de l’Agriculture (USDA) et sont donc considérées comme très représentatives de la diversité génétique du soja. Nous avons d’abord identifié les haplotypes régionaux locaux dans chacune des 62 accessions de G. soja et 240 accessions de G. max qui étaient identiques par descendance (IBD) aux individus des sous-populations de G. soja et G. max en utilisant toutes les données SNP des 302 accessions selon une approche décrite précédemment . Pour calculer les fréquences des haplotypes partagés dans différentes régions le long de chaque chromosome du génome du soja, nous avons divisé chaque chromosome en cases de 10 kb et calculé le nombre de tracés IBD enregistrés entre chaque accession et les deux sous-populations G. soja et G. max par case par des comparaisons par paire. Ces nombres ont été normalisés de 0 (aucune IBD détectée) à 1 (IBD partagée par tous les individus d’une sous-population), et les IBD normalisées entre chaque accession et la sous-population G. soja (nIBDG. soja) et entre chaque accession et la sous-population G. max (nIBDG. max) ont été utilisées pour calculer l’IBD relative (rIBD) entre les groupes comparés (rIBD = nIBDG. soja – nIBDG. max). Enfin, l’introgression génomique putative de la sous-population G. soja à chacune des accessions de soja cultivé et de la sous-population G. max à chacune des accessions de soja sauvage a été identifiée.

Par cette approche, 297 des 302 accessions ont été détectées comme contenant une introgression interspécifique putative (fichier supplémentaire 1 : tableau S1, fichier supplémentaire 2 : figure S1). Les 110 variétés élites ont été exclues des analyses ultérieures parce que ces variétés présentaient des taux d’introgression relativement faibles à partir du soja sauvage (0,00015~0,03) et parce que le développement de ces variétés impliquait une hybridation humaine qui pouvait masquer les événements d’introgression naturels. Un landrace a également été exclu des analyses ultérieures en raison de la qualité relativement faible de ses séquences génomiques et de son niveau élevé d’hétérozygotie. Parmi les accessions restantes, dont 62 accessions de G. soja et 129 landraces, les proportions de fragments introgressés détectés dans les génomes individuels vont de 0,00037 à 0,60, avec une moyenne de 0,032 (Fig. 1, Fichier supplémentaire 1 : Tableau S1). La distribution chromosomique de l’introgression détectée dans les accessions avec > 0,05 (5%) fragments introgressés dans les génomes individuels (fichier supplémentaire 1 : tableau S1) est illustrée dans la figure 2. Parmi les génomes de G. soja, les proportions de fragments G. max détectés vont de 0,00059 à 0,41, avec une moyenne de 0,019 (fichier supplémentaire 2 : figure S1, panneau supérieur). Parmi les génomes de G. max, les proportions de fragments de G. soja détectés vont de 0,00037 à 0,60, avec une moyenne de 0,031 (fichier supplémentaire 2 : figure S1, panneau inférieur). Au total, 43,94% et 54,61% des fragments introgressés putatifs dans les sous-populations G. soja et G. max sont partagés par deux ou plusieurs accessions, et le reste est spécifique à l’accession (Additional file 2 : Figure S2). Aucun des fragments introgressés putatifs détectés dans cette étude n’était entièrement fixé dans les sous-populations G. soja ou G. max (figure 2).

Fig. 1
figure1

Arbre phylogénétique de voisinage d’un panel de soja sauvage et cultivé. L’arbre a été construit sur la base de SNP à l’échelle du génome détectés par reséquençage du génome en utilisant le programme MEGA. Les branches marquées en rouge et en bleu indiquent G. soja et G. max (landrace), respectivement. Les codes des accessions individuelles et la fraction des fragments introgressés sont indiqués dans les couches extérieures de l’arbre

Fig. 2
figure2

Distribution à l’échelle du génome de l’introgression interspécifique et des caractéristiques génomiques. Les anneaux du cercle, de l’extérieur vers l’intérieur, montrent les chromosomes, y compris (i) les bras chromosomiques (couleur grise) et les régions péricentromériques (couleur verte), (ii) la distribution chromosomique des taux d’introgression dans l’ensemble de la population, (iii) la distribution chromosomique des QTL liés à la domestication comme indiqué par les barres rouges dans l’anneau correspondant, (iv) la distribution chromosomique des balayages sélectifs comme indiqué par les barres rouges dans l’anneau correspondant, (v) la distribution chromosomique de l’introgression interspécifique dans chacun des 12 G. max et 10 accessions de G. soja, comme indiqué par les 22 anneaux, dont les génomes possèdent chacun plus de 5% de fragments introgressés. Dans ces 22 anneaux, les segments G. max sont représentés en bleu et les segments G. soja en orange

Des analyses antérieures de la structure de la population et du mélange dans le soja ont révélé des régions génomiques locales présentant des similitudes exceptionnelles entre G. soja et G. max (5, 7), qui ont été considérées comme des preuves d’introgression génomique. L’analyse rIBD définissant les régions génomiques locales des accessions individuelles impliquées dans l’introgression putative décrite ci-dessus fournit des preuves supplémentaires en faveur de l’introgression G. soja-G. max. Néanmoins, il reste une possibilité que certaines des introgressions putatives, en particulier les fragments putatifs de G. soja détectés dans le fond de G. max, puissent résulter d’un triage incomplet des lignées de polymorphismes ancestraux existants dans la population source utilisée dans le processus de domestication. Dans le but de recueillir des preuves supplémentaires pour soutenir l’hypothèse de l’introgression, nous avons effectué une analyse statistique D pour les grandes régions putatives d’introgression de G. max détectées dans les 8 accessions de G. soja (Fig. 2) en comparaison par paires avec 10 accessions de G. max sélectionnées au hasard sans introgression détectée (Fig. 3). max sans introgression détectée (Fig. 1) et pour les grandes régions introgressées putatives de G. soja détectées dans les 14 accessions de G. max (Fig. 2) en comparaison par paires avec 10 accessions de G. soja sélectionnées au hasard sans introgression détectée (Fig. 1). Comme le montre la Fig. 3a, la statistique D pour les régions abritant une introgression putative (D = – 0,15 ± 0,07) était significativement inférieure à celle des régions sans introgression putative (D = – 0,08 ± 0,05) et était également significativement inférieure à la moyenne à l’échelle du génome (D = – 0,11 ± 0,04), ce qui suggère que le flux génétique entre les taxons G. soja et G. max était impliqué dans ces régions génomiques avec introgression putative détectée.

Fig. 3
figure3

L’analyse de la statistique D révèle des modèles distincts de flux de gènes dans différentes régions entre G. soja et G. max. une statistique D pour les grandes régions putatives G. max détectées dans les 8 accessions de G. soja/grandes régions putatives d’introspection de G. soja détectées dans les 14 accessions de G. max en comparaison par paire avec ces régions dans 10 accessions de G. max sélectionnées au hasard. max/10 accessions G. max sans introgression interspécifique détectée par rapport aux régions sans introgression putative. b Statistique D pour les régions péricentromériques par rapport aux bras chromosomiques dans la comparaison par paires entre les accessions comme décrit en a. Différences significatives (valeurs p < 0.05) entre les régions comparées, comme indiqué par des lettres différentes dans les boxblots, ont été détectées par le test de Kolmogorov-Smirnov

Pour tenter de suivre l’origine de l’introgression détectée, nous avons comparé des segments d’introgression importants et représentatifs dans une accession de G. soja (PI 578357, s61) et un landrace (PI 339734, m30), qui ont été estimés porter 33% et 31% de fragments introgressés, respectivement, avec les régions correspondantes dans d’autres accessions. L’introgression putative à l’échelle du génome dans une accession de G. soja PI 578357 (s61), l’une des accessions de G. soja adjacentes aux clades de G. max, a été illustrée dans la figure 4b et le fichier supplémentaire 2 : Figure S3.

Fig. 4
figure4

Exemplarité de l’introgression et des origines putatives de l’introgression illustrées par l’identique relatif par descendance (rIBD). a-c Composante génomique le long du chromosome 2 dans trois accessions apparentées Heihexiaohuangdou, PI 578357 et PI 522226. Une accession de G. soja (b) porte des fragments de G. max introgressés partageant la plus grande similarité avec les régions correspondantes d’un landrace (a), et les segments de G. soja partageant la plus grande similarité avec les régions correspondantes d’une accession de G. soja (c). d L’arbre du cladogramme basé sur les SNP dans les régions d’introgression du chromosome 2 montrant l’origine G. max (Heihexiaohuangdou, bleu) des régions dans l’accession de G. soja PI 578357, comme indiqué par la flèche. e L’arbre du cladogramme basé sur les SNP dans les régions de non-introgression montrant l’origine G. soja (PI 522226, rouge) des régions dans PI 578357, comme indiqué par la flèche. f Distribution géographique des trois accessions apparentées. g-i Composant génomique le long du chromosome 19 dans trois accessions apparentées PI 548456, PI 339734, et PI 407275. Une accession G. max (h) porte des fragments G. soja introgressés partageant la plus grande similarité avec les régions correspondantes d’une accession G. soja (i) et les segments G. max partageant la plus grande similarité avec les régions correspondantes d’une accession G. max (g). j L’arbre du cladogramme basé sur les SNP dans les régions de non-introgression montrant l’origine G. max (PI 548456, bleu) des régions de la PI 339734, comme indiqué par la flèche. k L’arbre du cladogramme basé sur les SNP dans les régions d’introgression du chromosome 2 montrant l’origine G. soja (PI 407275, rouge) des régions de l’accession G. max PI 339734, comme indiqué par la flèche. l Distribution géographique des trois accessions apparentées

Les régions d’introgression de PI 578357 couvrent toute la région péricentromérique du chromosome 2 sans QTL de domestication précédemment détectés (Fig. 2) et ont donc été considérées comme ayant subi une pression sélective minimale pour leur rétention. Nous avons constaté que les régions examinées du chromosome 2 chez PI 578357, cultivé à Amur, Russie, partagent la plus grande similarité de séquence avec leurs régions correspondantes dans un landrace Heihexiaohuangdou (m104) cultivé à Heihe, Chine (Fig. 4a, b, d, f). En revanche, les régions de non-introgression de PI 578357 partagent la plus grande similarité avec leurs régions correspondantes dans une accession de G. soja PI 522226 (s5) cultivée à Primorye, en Russie (Fig. 4b, c, e, f), qui est l’une des accessions de G. soja les plus divergentes de PI 578357 et de la lignée de G. max (Fig. 1), et il est donc peu probable qu’elle soit impliquée dans la population source utilisée pour la domestication du soja ou qu’elle en dérive. On a constaté que les régions d’introgression du chromosome 19 de la PI 339734, une variété cultivée en Corée, partageaient la plus grande similarité de séquence avec les régions correspondantes de l’accession G. soja PI 407275 (s42), également cultivée en Corée (Fig. 4h, i, k, l). En revanche, les régions de non-introgression de PI 339734 partagent la plus grande similarité avec les régions correspondantes d’un landrace PI 548456 (m111) qui a également été cultivé à Pyongyang, en Corée du Nord (Fig. 4g, h, j, l). La distribution géographique, les schémas et les niveaux de similarité et de divergence des séquences des régions génomiques locales, ainsi que la diversité des séquences à l’échelle du génome et la phylogénie de ces accessions suggèrent que le chimérisme des chromosomes détecté, comme décrit ci-dessus, résulte très probablement d’une introgression interspécifique et non d’un tri incomplet des polymorphismes ancestraux dans la population source pour la domestication du soja. Sur la base des séquences génétiques de l’ensemble du génome, les temps de divergence entre PI 578357 et Heihexiaohuangdou et entre PI 339734 et PI 407275 ont été datés à ~ 0,37 et 0,27 million d’années (mya), respectivement. Comme la domestication du soja n’a eu lieu qu’il y a ~ 6000-9000 ans , un tel niveau de similitude des régions d’introgression examinées entre les deux paires d’accessions (G. soja-G. max) exemplifiées ci-dessus doit être considéré comme une preuve directe de l’introgression de G. soja-G. max.

Facteurs façonnant le paysage de l’introgression de G. soja-G. max introgression

Pour comprendre les forces évolutives qui façonnent la distribution de l’introgression génomique dans les deux sous-populations, nous avons d’abord comparé les proportions moyennes de fragments introgressés entre les régions péricentromériques et les bras chromosomiques qui ont été grossièrement définis sur la base des taux de recombinaison génétique locale et des positions physiques des répétitions enrichies au centromère dans le génome du soja . En général, les régions péricentromériques présentent des taux de recombinaison génétique fortement réduits et une accumulation biaisée pour les mutations délétères telles que l’insertion d’éléments transposables par rapport aux bras chromosomiques. Nous avons constaté que, malgré quelques exceptions, dans l’ensemble, les régions péricentromériques présentent des proportions plus élevées de fragments introgressés, que ce soit dans la sous-population G. soja ou dans la sous-population G. max (test t de Student apparié, valeur p < 0,01, figure 2 et fichier additionnel 3 : tableau S2). L’analyse statistique D pour les régions péricentromériques en comparaison avec les bras a été effectuée en utilisant le même sous-ensemble d’accessions G. max et G. soja. Comme le montre la figure 3b, la statistique D des régions péricentromériques (D = – 0,12 ± 0,06) était nettement inférieure à celle des bras de chromosomes (D = – 0,09 ± 0,02) (figure 3b), ce qui suggère une accumulation biaisée du flux génétique dans les régions péricentromériques. Un tel biais peut être partiellement le résultat des taux réduits de recombinaison génétique et donc d’une efficacité réduite dans la purge des variations/fragments introgressés dans les régions péricentromériques par rapport aux bras chromosomiques.

Théoriquement, l’introgression génomique a résulté d’une hybridation spontanée, et les rétrocroisements ultérieurs impliquant G. soja et G. max devraient avoir subi deux pressions de sélection distinctes : la sélection naturelle pour les traits sauvages vers la formation de G. soja ou d’accessions similaires à G. soja adaptées aux environnements naturels, et la sélection artificielle pour les traits cultivés vers le développement d’accessions G. max ou similaires à G. max adaptées à la culture. Si c’est le cas, nous nous attendons à observer des modèles distincts de distribution des fragments introgressés entre le G. soja et le G. max. soja et G. max. Pour vérifier cette hypothèse, nous avons d’abord estimé les proportions de fragments introgressés dans 122 balayages sélectifs (Fig. 2) qui présentaient de fortes réductions de la variation nucléotidique de la sous-population G. soja à la sous-population G. max . Ces régions du soja cultivé sont probablement le résultat d’une forte pression sélective agissant sur des loci particuliers associés à la domestication du soja. Comme prévu, une proportion significativement plus faible de fragments G. max dans les régions correspondant aux régions de balayage sélectif par rapport au reste du génome a été détectée dans les accessions G. soja (test t de Student apparié, valeur p = 0,002667, Fig. 5a). En revanche, une proportion significativement plus faible de fragments de G. soja dans les régions de balayage sélectif par rapport à la partie restante du génome a été détectée dans les accessions de G. max (test t de Student apparié, valeur p = 2,542e-09, Fig. 5c).

Fig. 5
figure5

Modèles de sélection naturelle et de sélection artificielle contre l’introgression génomique. a Proportions de fragments G. max introgressés dans les régions de balayage sélectif par rapport à celles du génome entier détectées dans la G. soja. b Proportions de fragments G. max introgressés dans les régions QTL liées à la domestication par rapport à celles du génome entier détectées dans la sous-population G. soja. c Proportions de fragments G. soja introgressés dans les régions de balayage sélectif par rapport à celles du génome entier détectées dans la sous-population G. max. d Proportions de fragments G. soja introgressés dans les régions QTL liées à la domestication par rapport à celles du génome entier détectées dans la sous-population G. max. La différence significative dans chaque comparaison a été calculée par le test t de Student apparié. ***p < 0,001

En outre, nous avons estimé les proportions de fragments introgressés dans 44 régions QTL sous-jacentes à la domestication du soja (Fig. 2). Ces QTL ont été récemment identifiés en utilisant environ 800 lignées consanguines recombinantes (RIL) dérivées de croisements entre Williams 82 et chacune des 2 accessions G. soja PI 468916 (s14) et PI 479752 (s15) . Nous avons constaté que la proportion de fragments introgressés dans les régions QTL de domestication correspondantes des accessions G. max ou G. soja est encore plus faible que celle détectée dans les régions de balayage sélectif (Fig. 5b, d). L’ensemble de ces observations indique des résultats et des effets distincts de la sélection bidirectionnelle, c’est-à-dire la sélection naturelle par rapport à la sélection artificielle, sur le processus de domestication, sélection naturelle contre sélection artificielle, sur la rétention des fragments introgressés dans les sous-populations de G. soja et G. max.

Flux de gènes médiés par l’introgression entourant les gènes clés de la domestication

L’introgression génomique a été réalisée comme une avenue majeure pour le flux de gènes ; nous nous sommes demandés comment le flux de gènes peut avoir affecté le processus de domestication et l’architecture génétique du génome du soja au niveau de la population. Récemment, deux gènes clés de la domestication du soja, GmHs1-1 et Bloom1 (B1), qui contrôlent respectivement la dureté des graines et la floraison du tégument, ont été isolés. L’imperméabilité et la floraison du tégument ont été considérées comme importantes ou essentielles pour la survie à long terme du soja sauvage, tandis que le tégument perméable sans floraison était souhaitable pour la production agricole et la consommation humaine et était ciblé pour la sélection dans le cadre de la domestication. La mutation causale à chacun des deux loci pour la transition clé de la domestication a été identifiée et validée fonctionnellement . Une mutation récessive (C→T) dans la région codante de GmHs1-1 a entraîné la transition d’un tégument imperméable dans le soja sauvage à un tégument perméable dans le soja cultivé, et la sélection pour l’allèle domestiqué Gmhs1-1 a formé une région de balayage sélectif de ~ 160 kb . Une mutation récessive (C→T) dans la région codante de B1 était responsable de la perte de la floraison de l’enveloppe de la graine dans le soja cultivé, et la sélection de l’allèle domestiqué b1 a entraîné une région de balayage sélectif de ~ 301 kb . À notre connaissance, ce sont les deux seuls gènes identifiés à ce jour dont les deux allèles peuvent presque exclusivement distinguer le soja sauvage du soja cultivé, et entre-temps, la mutation causale identique à chacun des deux loci pour les phénotypes domestiqués est partagée par le soja cultivé.

En utilisant les SNP dans les deux régions de balayage sélectif entourant les loci GmHS1-1/Gmhs1-1 et B1/b1, nous avons construit les relations phylogénétiques entre les 62 accessions de G. soja et 129 landraces. L’introgression putative impliquant les 2 régions de balayage sélectif a été définie par les relations phylogénétiques. Dans la région GmHs1-1/Gmhs1-1 d’environ 160 kb, on a découvert que 13 variétés locales possédaient une région GmHs1-1 semblable à celle du G. soja, tandis qu’une seule accession de G. soja, PI 366121 (s58), possédait une région Gmhs1-1 semblable à celle du G. max (Fig. 6a). Les régions GmHs1-1 semblables à celles de G. soja trouvées dans les 13 variétés locales étaient dispersées dans tous les clades principaux de la population de G. soja (Fig. 6a), alors que seul un sous-ensemble des clades des régions GmHs1-1 peut être la source de sélection de l’allèle Gmhs1-1 pendant la domestication. Ainsi, les diverses régions GmHs1-1 dans ces variétés locales sont plus probablement le résultat d’une introgression interspécifique. Dans la région B1/b1 de ~ 301 kb, PI 339734 s’est révélé être le seul landrace possédant la région B1 semblable à celle de G. soja, tandis que PI 549046 (s28) s’est avéré être la seule accession de G. soja contenant la région b1 semblable à celle de G. max (Fig. 6b), qui est presque identique à celle d’une variété de G. max PI 437654 (m47) (Fig. 6b). Cette accession de G. soja a été regroupée phylogénétiquement, au niveau du génome entier, dans un clade qui est distant des autres clades de G. soja adjacents à G. max (Fig. 1), ce qui suggère que la région b1 de cette accession de G. soja est probablement issue de G. max par flux génétique. Parmi ces landraces, PI 339734 est la seule accession traitant à la fois les régions GmHs1-1 et B1 (Fig. 6a, b).

Fig. 6
figure6

Relations phylogénétiques entre les 191 accessions révélées par comparaison avec deux régions de balayage sélectif. a La région GmHs1-1 et b la région B1. Les astérisques marquent les accessions G. soja et G. max contenant des fragments introgressés de G. max et G. soja, respectivement

Les balayages sélectifs entourant les QTL de domestication sont généralement détectables au niveau des populations, mais les limites des haplotypes spécifiques sous sélection dans une région de balayage sélectif particulière varient entre les accessions individuelles. Pour mieux suivre les empreintes du flux génétique impliquant ces loci de domestication clés, nous avons fait un zoom sur les deux gènes de domestication et leurs séquences adjacentes, y compris les séquences promotrices et terminatrices présumées respectives, en nous concentrant sur la mutation causale qui a donné lieu à l’allèle de domestication à chaque locus. Au locus GmHs1-1/Gmhs1-1, on a constaté que 13 cultivars partageaient les haplotypes G. soja ou G. soja-like, y compris le nucléotide (C) spécifique de GmHs1-1, tandis que 7 accessions de G. soja possédaient l’haplotype G. max ou G. max-like, y compris le nucléotide (T) spécifique de Gmhs1-1 (Fig. 6a et fichier additionnel 2 : Figure S4). Conformément à la phylogénie des régions de balayage B1/b1 parmi les 191 accessions (Fig. 6b), G. soja PI 549046 (s28) possède l’haplotype b1, y compris la mutation causale (T) pour b1, qui est identique à celui des 191 cultivars, tandis que l’haplotype du cultivar PI 339734 (m30) est très identique à celui de la majorité des cultivars de G. soja, y compris le nucléotide (C) spécifique de B1 (fichier supplémentaire 2 : figure S5). Compte tenu de la distinction phylogénétique des sous-populations G. soja et G. max, le mélange détecté des régions de balayage sélectif et des haplotypes aux deux loci du gène de domestication dans la population étudiée serait considéré comme une preuve supplémentaire du flux génétique inter-sous-population.

Introgression révélée par la diversification asymétrique entre les génomes nucléaires et organellaires

Du fait que les croisements entre G. soja et G. max peuvent être facilement réalisés pour produire des graines fertiles, l’introgression ou le flux de gènes détectés dans cette étude comme décrit ci-dessus a été pensé comme des reliques de cycles d’hybridation spontanée impliquant ces deux pools de gènes par la dissémination du pollen et/ou la dispersion des graines. En théorie, certains des événements d’hybridation devraient être détectés par comparaison avec leurs génomes organellaires dans le contexte de l’architecture génétique définie par leurs génomes nucléaires. Nous avons donc analysé les séquences du génome chloroplastique des 191 accessions de soja reséquencées. Parmi les 191 génomes chloroplastiques, un total de 333 SNP très précis ont été identifiés et ensuite utilisés pour construire l’arbre phylogénétique (Fig. 7). Globalement, les 191 génomes chloroplastiques ont été regroupés en deux sous-groupes, le sous-groupe G. max et le sous-groupe G. soja. Comme prévu, les génomes chloroplastiques des accessions de G. max au sein du sous-groupe G. max sont moins divergents que ceux des accessions de G. soja au sein du sous-groupe G. soja. Malgré la distinction claire des génomes chloroplastiques entre les sous-groupes G. max et G. soja, 24 accessions G. max ont été regroupées dans le sous-groupe G. soja et 3 accessions G. soja ont été regroupées dans le sous-groupe G. max (Fig. 7). Ces observations indiquent l’existence d’événements d’hybridation G. soja-G. max avec soit G. soja soit G. max comme parent maternel. De tels événements ont apparemment remodelé l’architecture génétique des génomes nucléaires des deux sous-populations G. soja et G. max.

Fig. 7
figure7

Divergence asymétrique des génomes nucléaires et chloroplastiques entre les accessions G. max et G. soja. L’arbre phylogénétique des génomes nucléaires des 191 accessions a été construit en utilisant tous les SNP détectés dans le génome entier, tandis que l’arbre phylogénétique du chloroplaste du même ensemble d’accessions a été construit en utilisant 333 SNP hautement confiants distribués à travers le génome du chloroplaste. Les accessions de G. max ont été indiquées par les branches bleues de 2 arbres et marquées par des points bleus tandis que les accessions de G. soja ont été indiquées par les branches rouges de 2 arbres et marquées par des points rouges. Les mêmes accessions dans les 2 arbres ont été reliées par des lignes. Les lignes bleues indiquent les accessions G. max possédant les chloroplastes de type G. soja, les lignes orange indiquent les accessions G. soja possédant les chloroplastes de type G. max, et les lignes grises indiquent les accessions G. soja et G. max possédant les types de chloroplastes G. soja et G. max, respectivement

Pour les accessions G. max et G. soja possédant des chloroplastes G. max et G. soja respectifs, les accessions plus étroitement apparentées selon leurs génomes nucléaires ont tendance à partager des haplotypes identiques ou plus similaires de leurs génomes chloroplastiques (Fig. 7 et Fichier additionnel 2 : Figure S6), ce qui suggère une coévolution entre les génomes nucléaires et les génomes chloroplastiques comme modèle général. Cependant, des exceptions apparentes ont également été observées. Par exemple, certaines accessions avec des génomes nucléaires très divergents ont été détectées comme partageant des haplotypes identiques ou presque identiques des génomes chloroplastiques, et certaines accessions avec des génomes nucléaires plus étroitement liés ont été détectées comme ayant des haplotypes plus divergents des génomes chloroplastiques (Additional file 2 : Figure S6). Ces exceptions suggèrent que des événements d’hybridation entre des accessions très divergentes en termes de génomes nucléaires au sein de la sous-population G. max ou de la sous-population G. soja ont également eu lieu, et ces événements sont très probablement responsables de la diversification variétale inégalée observée entre les génomes nucléaires et chloroplastiques.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.