Genomische Introgression durch interspezifische Hybridisierung wirkt genetischem Engpass während der Domestizierung der Sojabohne entgegen

Genomweite Identifizierung mutmaßlicher Introgression von G. soja-G. max Introgression

Um die genomweite Introgression zwischen kultivierten und wilden Sojabohnen zu untersuchen, analysierten wir die Ganzgenom-Resequenzierungsdaten einer repräsentativen Sojabohnenpopulation, die 62 G. soja-Akzessionen, 130 Landsorten und 110 verbesserte Sojabohnensorten umfasst, die aus verschiedenen ökogeografischen Regionen in China und anderen Ländern wie Korea, Japan, Russland, den USA und Kanada stammen. Diese Proben verteilten sich auf fast alle wichtigen phylogenetischen Kladen/Gruppen von 18 480 domestizierten Sojabohnen-Akzessionen und 1168 wilden Sojabohnen-Akzessionen, die in 84 Ländern gesammelt oder in den USA entwickelt wurden und in der Sojabohnen-Keimplasma-Sammlung des US-Landwirtschaftsministeriums (USDA) hinterlegt sind und somit als sehr repräsentativ für die genetische Vielfalt von Sojabohnen gelten. Zunächst identifizierten wir in jeder der 62 G. soja- und 240 G. max-Zugänge lokale regionale Haplotypen, die mit Individuen innerhalb der G. soja- und G. max-Subpopulationen durch Abstammung (IBD) identisch waren, indem wir alle SNP-Daten aus den 302 Zugängen nach einem zuvor beschriebenen Ansatz verwendeten. Um die Häufigkeit der gemeinsamen Haplotypen in verschiedenen Regionen entlang jedes Chromosoms des Sojabohnengenoms zu berechnen, unterteilten wir jedes Chromosom in Bins von 10 kb und berechneten die Anzahl der aufgezeichneten IBD-Trakte zwischen jeder Akzession und den beiden Subpopulationen von G. soja und G. max pro Bin durch paarweise Vergleiche. Diese Zahlen wurden von 0 (keine IBD entdeckt) bis 1 (IBD, die von allen Individuen innerhalb einer Subpopulation geteilt wird) normalisiert, und die normalisierten IBD zwischen jeder Akzession und der G. soja-Subpopulation (nIBDG. soja) und zwischen jeder Akzession und der G. max-Subpopulation (nIBDG. max) wurden zur Berechnung der relativen IBD (rIBD) zwischen den verglichenen Gruppen verwendet (rIBD = nIBDG. soja – nIBDG. max). Schließlich wurde die mutmaßliche genomische Introgression von der G. soja-Subpopulation zu jeder der kultivierten Sojabohnen-Akzessionen und von der G. max-Subpopulation zu jeder der wilden Sojabohnen-Akzessionen identifiziert.

Mit diesem Ansatz wurde bei 297 der 302 Akzessionen eine mutmaßliche interspezifische Introgression festgestellt (Zusatzdatei 1: Tabelle S1, Zusatzdatei 2: Abbildung S1). Die 110 Elitesorten wurden von weiteren Analysen ausgeschlossen, da diese Sorten relativ geringe Introgressionsraten von der wilden Sojabohne aufwiesen (0,00015~0,03) und weil die Entwicklung dieser Sorten mit einer vom Menschen verursachten Hybridisierung einherging, die natürlich auftretende Introgressionsereignisse verdecken könnte. Eine Landrasse wurde aufgrund der relativ geringen Qualität der genomischen Sequenzen und der hohen Heterozygotie von den weiteren Analysen ausgeschlossen. Bei den verbleibenden Akzessionen, darunter 62 G. soja-Akzessionen und 129 Landrassen, liegen die Anteile der entdeckten introgressiven Fragmente in den einzelnen Genomen zwischen 0,00037 und 0,60, mit einem Durchschnitt von 0,032 (Abb. 1, Additional file 1: Table S1). Die chromosomale Verteilung der nachgewiesenen Introgression in Akzessionen mit > 0,05 (5 %) introgressierten Fragmenten in einzelnen Genomen (Zusatzdatei 1: Tabelle S1) ist in Abb. 2 dargestellt. Bei den G. soja-Genomen reicht der Anteil der entdeckten G. max-Fragmente von 0,00059 bis 0,41, mit einem Durchschnitt von 0,019 (Additional file 2: Abbildung S1, oberes Feld). Bei den G. max-Genomen reicht der Anteil der entdeckten G. soja-Fragmente von 0,00037 bis 0,60, mit einem Durchschnitt von 0,031 (Zusätzliche Datei 2: Abbildung S1, unteres Feld). Insgesamt werden 43,94 % und 54,61 % der mutmaßlich introgressiven Fragmente in den Subpopulationen von G. soja und G. max von zwei oder mehr Akzessionen geteilt, und die übrigen sind akzessionsspezifisch (Zusatzdatei 2: Abbildung S2). Keines der in dieser Studie entdeckten mutmaßlichen introgressiven Fragmente war in den Subpopulationen von G. soja oder G. max vollständig fixiert (Abb. 2).

Abb. 1
Abbildung1

Phylogenetischer Nachbarschaftsbaum einer Gruppe von Wild- und Kultursojabohnen. Der Baum wurde auf der Grundlage genomweiter SNPs konstruiert, die durch Genom-Resequenzierung mit dem MEGA-Programm ermittelt wurden. Rot und blau markierte Äste stehen für G. soja bzw. G. max (Landrasse). Die Codes für die einzelnen Akzessionen und der Anteil der introgressierten Fragmente sind in den äußeren Schichten des Baums dargestellt

Abb. 2
Abb. 2

Genomweite Verteilung der interspezifischen Introgression und genomischen Merkmale. Die Ringe des Kreises, von außen nach innen, zeigen Chromosomen, einschließlich (i) Chromosomenarme (graue Farbe) und perizentromerische Regionen (grüne Farbe), (ii) chromosomale Verteilung der Introgressionsraten in der gesamten Population, (iii) chromosomale Verteilung von Domestikations-bezogenen QTL, wie durch rote Balken im entsprechenden Ring angezeigt, (iv) chromosomale Verteilung von selektiven Sweeps, wie durch rote Balken im entsprechenden Ring angezeigt, (v) chromosomale Verteilung der interspezifischen Introgression in jedem der 12 G. max und 10 G. soja-Akzessionen, wie in den 22 Ringen angegeben, deren Genome jeweils mehr als 5 % introgressierte Fragmente aufweisen. In diesen 22 Ringen wurden die G. max-Segmente in blau und die G. soja-Segmente in orange dargestellt

Vorangegangene Analysen der Populationsstruktur und der Vermischung bei Sojabohnen haben lokale genomische Regionen aufgedeckt, die außergewöhnliche Ähnlichkeiten zwischen G. soja und G. max aufweisen (5, 7), was als Beweis für genomische Introgression angesehen wurde. Die oben beschriebene rIBD-Analyse, die die lokalen genomischen Regionen einzelner Akzessionen definiert, die an der mutmaßlichen Introgression beteiligt waren, liefert weitere Beweise für die Introgression von G. soja und G. max. Dennoch besteht die Möglichkeit, dass ein Teil der mutmaßlichen Introgression, insbesondere die mutmaßlichen G. soja-Fragmente, die im G. max-Hintergrund nachgewiesen wurden, auf eine unvollständige Sortierung der Abstammungslinien bestehender Polymorphismen in der im Domestikationsprozess verwendeten Ausgangspopulation zurückzuführen sind. In einem Versuch, zusätzliche Beweise für die Hypothese der Introgression zu sammeln, führten wir eine D-Statistik-Analyse für die großen mutmaßlichen G. max-Introgressionsbereiche durch, die in den 8 G. soja-Akzessionen (Abb. 2) im paarweisen Vergleich mit 10 zufällig ausgewählten G. max-Akzessionen ohne nachgewiesene Introgression (Abb. 1) und für die großen mutmaßlichen G. soja-introgressiven Regionen, die in den 14 G. max-Akzessionen (Abb. 2) im paarweisen Vergleich mit 10 zufällig ausgewählten G. soja-Akzessionen ohne nachgewiesene Introgression (Abb. 1) nachgewiesen wurden. Wie in Abb. 3a gezeigt, war die D-Statistik für die Regionen mit mutmaßlicher Introgression (D = – 0,15 ± 0,07) signifikant niedriger als die Regionen ohne mutmaßliche Introgression (D = – 0,08 ± 0,05) und auch signifikant niedriger als der genomweite Durchschnitt (D = – 0,11 ± 0,04), was darauf hindeutet, dass in diesen genomischen Regionen mit nachgewiesener mutmaßlicher Introgression Genfluss zwischen den Taxa G. soja und G. max stattfand.

Abbildung 3
Abbildung3

D-Statistik-Analyse zeigt unterschiedliche Muster des Genflusses in verschiedenen Regionen zwischen G. soja und G. max. eine D-Statistik für große mutmaßliche G. max-Regionen, die in den 8 G. soja-Zugängen/großen mutmaßlichen G. soja-Regionen, die in den 14 G. max-Zugängen entdeckt wurden, im paarweisen Vergleich mit diesen Regionen in zufällig ausgewählten 10 G. max-Akzessionen/10 G. max-Akzessionen ohne nachgewiesene interspezifische Introgression im Vergleich zu Regionen ohne mutmaßliche Introgression. b D-Statistik für perizentromerische Regionen im Vergleich zu chromosomalen Armen im paarweisen Vergleich zwischen Akzessionen wie in a beschrieben. Signifikante Unterschiede (p-Werte < 0.05) zwischen den verglichenen Regionen, wie durch unterschiedliche Buchstaben in den Boxblots angegeben, wurden durch den Kolmogorov-Smirnov-Test ermittelt

In einem Versuch, den Ursprung der entdeckten Introgression zu verfolgen, verglichen wir große und repräsentative Introgressionssegmente in einer G. soja (PI 578357, s61) und einer Landrasse (PI 339734, m30), die schätzungsweise 33 % bzw. 31 % introgressive Fragmente tragen, mit entsprechenden Regionen in anderen Akzessionen. Die genomweite mutmaßliche Introgression in der G. soja-Akzession PI 578357 (s61), einer der G. soja-Akzessionen, die an die G. max-Kladen angrenzt, wurde in Abb. 4b und Additional file 2 veranschaulicht: Abbildung S3.

Abb. 4
Abbildung4

Beispiel für Introgression und mutmaßliche Ursprünge der Introgression, veranschaulicht durch relative Identität durch Abstammung (rIBD). a-c Genomische Komponente entlang Chromosom 2 in drei verwandten Akzessionen Heihexiaohuangdou, PI 578357 und PI 522226. Eine G. soja-Akzession (b) trägt introgressierte G. max-Fragmente, die die größte Ähnlichkeit mit den entsprechenden Regionen einer Landrasse (a) aufweisen, und die G. soja-Segmente, die die größte Ähnlichkeit mit den entsprechenden Regionen einer G. soja-Akzession (c) aufweisen. d Der Kladogramm-Baum auf der Grundlage von SNPs in den Introgressionsregionen von Chromosom 2 zeigt den G. max-Ursprung (Heihexiaohuangdou, blau) der Regionen in G. soja-Akzession PI 578357, wie durch den Pfeil angezeigt. e Der Kladogrammbaum auf der Grundlage von SNPs in den Nicht-Introgressionsregionen zeigt den G. soja-Ursprung (PI 522226, rot) der Regionen in PI 578357, wie durch den Pfeil angezeigt. f Geografische Verteilung der drei verwandten Akzessionen. g-i Genomische Komponente entlang Chromosom 19 in den drei verwandten Akzessionen PI 548456, PI 339734 und PI 407275. Eine G. max-Akzession (h) trägt introgressierte G. soja-Fragmente, die die größte Ähnlichkeit mit den entsprechenden Regionen einer G. soja-Akzession (i) aufweisen, und die G. max-Segmente, die die größte Ähnlichkeit mit den entsprechenden Regionen einer G. max-Akzession (g) aufweisen. j Der Kladogrammbaum auf der Grundlage von SNPs in den Nicht-Introgressionsregionen zeigt den G. max (PI 548456, blau) Ursprung der Regionen in PI 339734, wie durch den Pfeil angezeigt. k Der Kladogrammbaum auf der Grundlage von SNPs in den Introgressionsregionen von Chromosom 2 zeigt den G. soja (PI 407275, rot) den Ursprung der Regionen in der G. max-Akzession PI 339734 zeigt (Pfeil). l Geografische Verteilung der drei verwandten Akzessionen

Die Introgressionsregionen in PI 578357 erstrecken sich über die gesamte perizentromerische Region von Chromosom 2 ohne zuvor nachgewiesene Domestikations-QTLs (Abb. 2), so dass davon ausgegangen wird, dass sie nur einem minimalen Selektionsdruck ausgesetzt waren. Wir stellten fest, dass die untersuchten Regionen von Chromosom 2 in PI 578357, das in Amur, Russland, angebaut wurde, die höchste Sequenzähnlichkeit mit den entsprechenden Regionen in der Landrasse Heihexiaohuangdou (m104) aufweisen, die in Heihe, China, angebaut wurde (Abb. 4a, b, d, f). Im Gegensatz dazu weisen die Nicht-Introgressionsregionen von PI 578357 die größte Ähnlichkeit mit den entsprechenden Regionen in der G. soja-Akzession PI 522226 (s5) auf, die in Primorje, Russland, angebaut wird (Abb. 4b, c, e, f). Diese Akzession gehört zu den G. soja-Akzessionen, die am stärksten von PI 578357 und von der G. max-Linie (Abb. 1) abweichen, und es ist daher unwahrscheinlich, dass sie an der für die Domestizierung der Sojabohne verwendeten Ausgangspopulation beteiligt ist oder von dieser stammt. Die Introgressionsregionen von Chromosom 19 in PI 339734, einer in Korea angebauten Landrasse, wiesen die größte Sequenzähnlichkeit mit den entsprechenden Regionen in der ebenfalls in Korea angebauten G. soja Akzession PI 407275 (s42) auf (Abb. 4h, i, k, l). Im Gegensatz dazu weisen die Nicht-Ingressionsregionen von PI 339734 die größte Ähnlichkeit mit den entsprechenden Regionen einer Landrasse PI 548456 (m111) auf, die ebenfalls in Pjöngjang, Nordkorea, angebaut wurde (Abb. 4g, h, j, l). Die geografische Verteilung, die Muster und das Ausmaß der Sequenzähnlichkeit und -divergenz lokaler genomischer Regionen sowie die gesamte genomweite Sequenzvielfalt und Phylogenie dieser Akzessionen deuten darauf hin, dass der oben beschriebene Chimärismus von Chromosomen höchstwahrscheinlich auf interspezifische Introgression und nicht auf eine unvollständige Sortierung der Abstammungslinien der Polymorphismen in der Ausgangspopulation für die Domestizierung von Sojabohnen zurückzuführen ist. Auf der Grundlage von Gensequenzen im gesamten Genom wurden die Divergenzzeiten zwischen PI 578357 und Heihexiaohuangdou sowie zwischen PI 339734 und PI 407275 auf ~ 0,37 bzw. 0,27 Millionen Jahre vor (mya) datiert. Da die Domestizierung der Sojabohne erst vor ca. 6000-9000 Jahren stattfand, sollte ein solch hoher Grad an Ähnlichkeiten der untersuchten Introgressionsregionen zwischen den beiden oben genannten Akzessionspaaren (G. soja-G. max) als direkter Beweis für die Introgression von G. soja-G. max angesehen werden.

Faktoren, die die Landschaft der G. soja-G. max Introgression

Um die evolutionären Kräfte zu verstehen, die die Verteilung der genomischen Introgression in den beiden Subpopulationen prägen, verglichen wir zunächst die durchschnittlichen Anteile der introgressierten Fragmente zwischen perizentromerischen Regionen und chromosomalen Armen, die grob auf der Grundlage der Raten der lokalen genetischen Rekombination und der physischen Positionen der Zentromer-angereicherten Wiederholungen im Sojabohnengenom definiert wurden. Im Allgemeinen weisen perizentromerische Regionen im Vergleich zu chromosomalen Armen stark reduzierte Raten der genetischen Rekombination und eine voreingenommene Akkumulation für schädliche Mutationen, wie z. B. die Einfügung von transponierbaren Elementen, auf. Wir fanden heraus, dass trotz einiger Ausnahmen die perizentromerischen Regionen insgesamt höhere Anteile an introgressierten Fragmenten sowohl in der G. soja-Subpopulation als auch in der G. max-Subpopulation aufweisen (gepaarter Student t-Test, p-Wert < 0,01, Abb. 2 und Additional file 3: Tabelle S2). Die D-Statistik-Analyse für perizentromerische Regionen im Vergleich zu Armen wurde mit derselben Untergruppe von G. max- und G. soja-Akzessionen durchgeführt. Wie in Abb. 3b gezeigt, war die D-Statistik für die perizentromerischen Regionen (D = – 0,12 ± 0,06) signifikant niedriger als für die Chromosomenarme (D = – 0,09 ± 0,02) (Abb. 3b), was auf eine verzerrte Akkumulation des Genflusses in perizentromerischen Regionen schließen lässt. Eine solche Verzerrung könnte zum Teil das Ergebnis der geringeren Raten genetischer Rekombination und damit einer geringeren Effizienz bei der Beseitigung introgressierter Variationen/Fragmente in perizentromerischen Regionen im Vergleich zu chromosomalen Armen sein.

Theoretisch resultierte die genomische Introgression aus spontaner Hybridisierung, und nachfolgende Rückkreuzungen zwischen G. soja und G. max zwei unterschiedlichen Selektionsdrucken unterworfen gewesen sein: natürliche Selektion für die wilden Merkmale zur Bildung von G. soja oder G. soja-ähnlichen Akzessionen, die an die natürliche Umwelt angepasst sind, und künstliche Selektion für kultivierte Merkmale zur Entwicklung von G. max oder G. max-ähnlichen Akzessionen, die für den Anbau geeignet sind. Wenn dies der Fall ist, würden wir erwarten, dass wir unterschiedliche Verteilungsmuster der introgressierten Fragmente zwischen den G. soja- und G. max-Subpopulationen. Um diese Hypothese zu testen, schätzten wir zunächst die Anteile der introgressierten Fragmente in 122 selektiven Sweeps (Abb. 2), die eine starke Verringerung der Nukleotidvariation von der Subpopulation G. soja zur Subpopulation G. max aufwiesen. Diese Regionen in kultivierten Sojabohnen sind wahrscheinlich das Ergebnis eines starken Selektionsdrucks, der auf bestimmte Loci im Zusammenhang mit der Domestizierung von Sojabohnen einwirkt. Wie erwartet wurde in den G. soja-Akzessionen ein signifikant geringerer Anteil an G. max-Fragmenten in den Regionen, die den selektiven Sweep-Regionen entsprechen, im Vergleich zum restlichen Teil des Genoms festgestellt (gepaarter Student t-Test, p-Wert = 0,002667, Abb. 5a). Im Gegensatz dazu wurde bei den G. max-Akzessionen ein signifikant geringerer Anteil an G. soja-Fragmenten in den selektiven Sweep-Regionen im Vergleich zum restlichen Teil des Genoms festgestellt (gepaarter Student t-Test, p-Wert = 2,542e-09, Abb. 5c).

Abb. 5
Abb. 5

Muster der natürlichen Selektion und der künstlichen Selektion gegen genomische Introgression. a Anteil der introgressierten G. max-Fragmente in selektiven Sweep-Regionen im Vergleich zu denen im gesamten Genom, die in der G. soja-Subpopulation. b Anteil der introgressierten G. max-Fragmente in domestikationsbezogenen QTL-Regionen im Vergleich zu denen im gesamten Genom, die in der G. soja-Subpopulation nachgewiesen wurden. c Anteil der introgressierten G. soja-Fragmente in selektiven Sweep-Regionen im Vergleich zu denen im gesamten Genom, die in der G. max-Subpopulation nachgewiesen wurden. d Anteil der introgressierten G. soja-Fragmente in domestikationsbezogenen QTL-Regionen im Vergleich zu denen im gesamten Genom, die in der G. max-Subpopulation nachgewiesen wurden. Signifikanter Unterschied in jedem Vergleich wurde durch den gepaarten Student t-Test berechnet. ***p < 0,001

Zusätzlich schätzten wir die Anteile der introgressierten Fragmente in 44 QTL-Regionen, die der Domestizierung von Sojabohnen zugrunde liegen (Abb. 2). Diese QTLs wurden vor kurzem anhand von etwa 800 rekombinanten Inzuchtlinien (RIL) identifiziert, die aus Kreuzungen zwischen Williams 82 und jeder der beiden G. soja-Akzessionen PI 468916 (s14) und PI 479752 (s15) stammen. Wir stellten fest, dass der Anteil der introgressierten Fragmente in den entsprechenden Domestikations-QTL-Regionen der G. max- oder G. soja-Akzessionen noch geringer ist als in den selektiven Sweep-Regionen (Abb. 5b, d). Zusammengenommen deuten diese Beobachtungen auf unterschiedliche Ergebnisse und Auswirkungen der bidirektionalen Selektion, d. h.,

Introgressionsvermittelter Genfluss um wichtige Domestikationsgene

Genomische Introgression ist als ein wichtiger Weg für den Genfluss erkannt worden; wir fragten uns, wie Genfluss den Domestikationsprozess und die genetische Architektur des Sojabohnengenoms auf Populationsebene beeinflusst haben könnte. Vor kurzem wurden zwei Schlüsselgene für die Domestizierung der Sojabohne isoliert: GmHs1-1 und Bloom1 (B1), die die Samenhärte bzw. das Aufblühen der Samenschale steuern. Die Undurchlässigkeit der Samenschale und das Aufblühen der Samenschale wurden als wichtig oder wesentlich für das langfristige Überleben der wilden Sojabohne angesehen, während eine durchlässige Samenschale ohne Aufblühen für die landwirtschaftliche Produktion und den menschlichen Verzehr wünschenswert war und bei der Domestizierung selektiert werden sollte. Die ursächliche Mutation an jedem der beiden Loci für den entscheidenden Domestikationsübergang wurde identifiziert und funktionell validiert. Eine rezessive Mutation (C→T) in der kodierenden Region von GmHs1-1 führte zum Übergang von einer undurchlässigen Samenschale in der wilden Sojabohne zu einer durchlässigen Samenschale in der kultivierten Sojabohne, und die Selektion für das domestizierte Allel Gmhs1-1 bildete eine ca. 160 KB große selektive Sweep-Region. Eine rezessive Mutation (C→T) in der kodierenden Region von B1 war für den Verlust der Samenschalenblüte in den kultivierten Sojabohnen verantwortlich, und die Selektion des domestizierten Allels b1 führte zu einer ~ 301 KB großen selektiven Sweep-Region. Unseres Wissens sind dies die einzigen zwei bisher identifizierten Gene, deren zwei Allele fast ausschließlich die wilden Sojabohnen von den kultivierten Sojabohnen unterscheiden können, und inzwischen ist die identische ursächliche Mutation an jedem der beiden Loci für die domestizierten Phänotypen auch bei den kultivierten Sojabohnen vorhanden.

Unter Verwendung von SNPs in den beiden selektiven Sweep-Regionen, die die GmHS1-1/Gmhs1-1- und B1/b1-Loci umgeben, haben wir die phylogenetischen Beziehungen zwischen den 62 G. soja-Akzessionen und 129 Landrassen konstruiert. Anhand der phylogenetischen Beziehungen wurde die mutmaßliche Introgression unter Beteiligung der beiden selektiven Sweep-Regionen bestimmt. In der etwa 160 KB großen GmHs1-1/Gmhs1-1-Region wurde festgestellt, dass 13 Landsorten eine G. soja-ähnliche GmHs1-1-Region besitzen, während nur eine G. soja-Akzession, PI 366121 (s58), die G. max-ähnliche Gmhs1-1-Region aufweist (Abb. 6a). Die G. soja-ähnlichen GmHs1-1-Regionen, die in den 13 Landsorten gefunden wurden, waren in allen Hauptkladen der G. soja-Population verstreut (Abb. 6a), während nur eine Teilmenge der Kladen der GmHs1-1-Regionen die Quelle für die Selektion für das Gmhs1-1-Allel während der Domestikation sein könnte. Daher sind die unterschiedlichen GmHs1-1-Regionen in diesen Landsorten wahrscheinlich eher das Ergebnis einer interspezifischen Introgression. In der 301-kb-B1/b1-Region erwies sich PI 339734 als die einzige Landsorte mit der G. soja-ähnlichen B1-Region, während PI 549046 (s28) die einzige G. soja-Akzession war, die die G. max-ähnliche b1-Region enthielt (Abb. 6b), die nahezu identisch mit der einer G. max-Sorte PI 437654 (m47) ist (Abb. 6b). Diese G. soja-Sorte wurde phylogenetisch auf der Ebene des gesamten Genoms in eine Klade eingeordnet, die von anderen G. soja-Kladen in der Nähe von G. max weit entfernt ist (Abb. 1), was darauf hindeutet, dass die b1-Region in dieser G. soja-Sorte wahrscheinlich durch Genfluss aus G. max entstanden ist. Unter diesen Landsorten ist PI 339734 die einzige Akzession, die sowohl die GmHs1-1- als auch die B1-Region verarbeitet (Abb. 6a, b).

Abb. 6
Abb. 6

Phylogenetische Beziehungen zwischen den 191 Akzessionen, die durch den Vergleich mit zwei selektiven Sweep-Regionen offenbart wurden. a Die GmHs1-1-Region und b die B1-Region. Sternchen markieren die G. soja- und G. max-Zugänge, die introgressierte Fragmente von G. max bzw. G. soja enthalten

Selektive Sweeps, die Domestikations-QTL umgeben, sind im Allgemeinen auf Populationsebene nachweisbar, aber die Grenzen spezifischer Haplotypen, die innerhalb einer bestimmten selektiven Sweep-Region selektiert werden, variieren zwischen einzelnen Zugängen. Um die Spuren des Genflusses an diesen wichtigen Domestikationsloci weiter zu verfolgen, haben wir die beiden Domestikationsgene und ihre angrenzenden Sequenzen, einschließlich der jeweiligen mutmaßlichen Promotor- und Terminatorsequenzen, näher untersucht, wobei wir uns auf die ursächliche Mutation konzentrierten, die zum Domestikationsallel an jedem Locus führte. Am GmHs1-1/Gmhs1-1-Locus wurde festgestellt, dass 13 Landsorten den G. soja- oder G. soja-ähnlichen Haplotyp einschließlich des GmHs1-1-spezifischen Nukleotids (C) aufweisen, während 7 G. soja-Zugänge den G. max- oder G. max-ähnlichen Haplotyp einschließlich des Gmhs1-1-spezifischen Nukleotids (T) besaßen (Abb. 6a und Zusatzdatei 2: Abbildung S4). In Übereinstimmung mit der Phylogenie der B1/b1-Sweep-Regionen unter den 191 Akzessionen (Abb. 6b), G. soja PI 549046 (s28) den b1-Haplotyp, einschließlich der ursächlichen Mutation (T) für b1, der mit dem von 191 Landsorten identisch ist, während der Haplotyp der Landsorte PI 339734 (m30) in hohem Maße mit dem der meisten G. soja-Akzessionen, einschließlich des B1-spezifischen Nukleotids (C), identisch ist (Additional file 2: Abbildung S5). In Anbetracht der phylogenetischen Unterscheidung zwischen den Subpopulationen von G. soja und G. max würde die festgestellte Vermischung der selektiven Sweep-Regionen und Haplotypen an den beiden Domestikationsgen-Loci in der untersuchten Population als weiterer Beweis für einen Genfluss zwischen den Subpopulationen angesehen werden.

Introgression durch asymmetrische Diversifizierung zwischen dem nuklearen und dem organellaren Genom

Da Kreuzungen zwischen G. soja und G. max leicht fruchtbare Samen hervorbringen können, wurde angenommen, dass die in dieser Studie entdeckte Introgression oder der oben beschriebene Genfluss Überbleibsel spontaner Hybridisierungsrunden sind, an denen diese beiden Genpools durch Pollen- und/oder Samenverbreitung beteiligt waren. Theoretisch könnten einige der Hybridisierungsereignisse durch den Vergleich ihrer organellaren Genome im Zusammenhang mit der durch ihre Kerngenome definierten genetischen Architektur nachgewiesen werden. Wir analysierten daher die Chloroplastengenomsequenzen der 191 neu sequenzierten Sojabohnensorten. Unter den 191 Chloroplastengenomen wurden insgesamt 333 hochpräzise SNPs identifiziert und dann zur Erstellung des phylogenetischen Baums verwendet (Abb. 7). Insgesamt wurden die 191 Chloroplastengenome in 2 Untergruppen geclustert, die G. max-Untergruppe und die G. soja-Untergruppe. Wie erwartet sind die Chloroplastengenome der G. max-Zugänge innerhalb der G. max-Untergruppe weniger stark divergiert als die der G. soja-Zugänge innerhalb der G. soja-Untergruppe. Trotz der klaren Unterscheidung der Chloroplastengenome zwischen den Untergruppen G. max und G. soja wurden 24 G. max-Zugänge in der Untergruppe G. soja und 3 G. soja-Zugänge in der Untergruppe G. max geclustert (Abb. 7). Diese Beobachtungen deuten auf das Auftreten von G. soja-G. max-Hybridisierungsereignissen mit entweder G. soja oder G. max als mütterlichem Elternteil hin. Solche Ereignisse haben offenbar die genetische Architektur der Kerngenome sowohl der G. soja- als auch der G. max-Subpopulationen umgestaltet.

Abb. 7
Abb. 7

Asymmetrische Divergenz der Kern- und Chloroplastengenome zwischen G. max- und G. soja-Zugängen. Der phylogenetische Baum der Kerngenome der 191 Akzessionen wurde unter Verwendung aller im gesamten Genom nachgewiesenen SNPs konstruiert, während der phylogenetische Baum des Chloroplasten derselben Akzessionen unter Verwendung von 333 hochsicheren SNPs, die über das Chloroplastengenom verteilt sind, konstruiert wurde. Die G. max-Akzessionen wurden durch blaue Zweige von 2 Bäumen und blaue Punkte gekennzeichnet, während die G. soja-Akzessionen durch rote Zweige von 2 Bäumen und rote Punkte gekennzeichnet wurden. Die gleichen Akzessionen in den 2 Bäumen wurden durch Linien verbunden. Blaue Linien kennzeichnen G. max-Zugänge, die Chloroplasten vom G. soja-Typ besitzen, orange Linien kennzeichnen G. soja-Zugänge, die Chloroplasten vom G. max-Typ besitzen, und graue Linien kennzeichnen G. soja- und G. max-Zugänge, die Chloroplasten vom G. soja- bzw. G. max-Typ besitzen

Für die G. max- und G. soja, die entsprechende G.-max- und G.-soja-Chloroplasten besitzen, neigen die nach ihren Kerngenomen näher verwandten Akzessionen dazu, identische oder ähnlichere Haplotypen ihrer Chloroplastengenome zu teilen (Abb. 7 und Zusatzdatei 2: Abbildung S6), was auf eine Koevolution zwischen den Kerngenomen und den Chloroplastengenomen als allgemeines Muster schließen lässt. Es wurden jedoch auch offensichtliche Ausnahmen beobachtet. So wurden beispielsweise bei einigen Akzessionen mit stark divergierenden Kerngenomen identische oder nahezu identische Haplotypen der Chloroplastengenome festgestellt, und bei einigen Akzessionen mit enger verwandten Kerngenomen wurden stärker divergierende Haplotypen der Chloroplastengenome festgestellt (Additional file 2: Abbildung S6). Solche Ausnahmen deuten darauf hin, dass Hybridisierungsereignisse zwischen hochgradig divergierenden Akzessionen in Bezug auf ihre Kerngenome innerhalb der G. max-Subpopulation oder innerhalb der G. soja-Subpopulation stattgefunden haben, und solche Ereignisse sind sehr wahrscheinlich für die beobachtete beispiellose Sortenvielfalt zwischen den Kern- und Chloroplastengenomen verantwortlich.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.