Unterschiede in der Farbkategorisierung von Männern und Frauen: eine quantitative World Color Survey-Studie

Kategoriestärke und Begriffskarten
Fallstudien: große Unterschiede zwischen weiblichen und männlichen Termkarten
Fall 1: Murle (L75)
Fall 2: Patep (L81)
Fall 3: Colorado (L30)
Fall 4: Tboli (L94)
Fall 5: Walpiri (L103)
Fall 6: Mahahua (L67)
Fall 7: Huastec (L45)
Fall 8: Cakchiquel (L17)
Männliche und weibliche Kategorieexemplare

Kategoriestärke und Begriffskarten

Wir haben unsere Methode angewandt, um BCTs für männliche und weibliche Populationen getrennt zu identifizieren. Die Begriffskarten sind im ergänzenden Abschnitt 7, Abb. S7-S97, für alle Sprachen der WCS mit mindestens acht männlichen und acht weiblichen Befragten dargestellt. Betrachtet man alle Farbwörter in allen WCS-Sprachen, so scheinen die männlichen und weiblichen Teilpopulationen in vielen Fällen einen ähnlichen Wortgebrauch zu verwenden. Wir sind jedoch daran interessiert, Fälle zu untersuchen, in denen das Benennungsverhalten von Männern und Frauen sehr unterschiedlich zu sein scheint. Um einige mögliche Ähnlichkeiten und Unterschiede in der Kategoriestärke zwischen Männern und Frauen zu veranschaulichen, beginnen wir mit zwei Beispielen. Abbildung 1 zeigt die weiblichen und männlichen Kategoriestärkewerte, CSF und CSM, nebeneinander für zwei WCS-Sprachen.

Die linke Tafel zeigt die Stärken der Kategorien in Bezug auf die männlichen und weiblichen Teilpopulationen der Sprache Bauzi (L12 in den WCS-Archiven). Jeder rote (blaue) Punkt steht für ein Farbwort und ist in einer Höhe aufgetragen, die seiner weiblichen (männlichen) Kategoriestärke, dem CSF-Wert (CSM), entspricht. Punkte, die demselben Wort entsprechen, sind durch schwarze Linien verbunden. Von den sieben Farbwörtern, die von den Sprechern der Sprache 12 verwendet werden, werden fünf als immer basische Farbwörter eingestuft (die beiden nie basischen Farbwörter haben die Kategoriestärke 0), und selbst wenn man sie in männliche und weibliche Untergruppen aufteilt, sind die fünf Wörter in Bezug auf beide Unterpopulationen immer basisch; die Reihenfolge der Kategoriestärke der Wörter ist bei Männern und Frauen sehr ähnlich. Die Termkarten für die männlichen und weiblichen Teilpopulationen, die wir für jede Kategorie, die einem Wort w entspricht, mit TMw,F und TMw,M bezeichnen, sind in Abb. 2 als Heatmaps dargestellt. Jedes rechteckige Pixel in den Begriffskarten stellt einen Farbchip dar, der im WCS verwendet wird, so dass die Pixel in den Begriffskarten und die WCS-Gitterchips in der gleichen Weise ausgerichtet sind; der vollständige WCS-Chipsatz ist in Abb. S1 im ergänzenden Abschnitt 1 zu sehen. Eine dunklere Schattierung in den Begriffskarten zeigt an, dass die entsprechenden Farben von einem größeren Teil der Teilpopulation mit dem Wort wi benannt werden. Eine weiße Färbung in den Termkarten zeigt an, dass die entsprechenden Farben nie mit dem Wort wi benannt werden. Wir sehen, dass das Benennungsverhalten von weiblichen und männlichen Sprechern bei allen fünf relevanten Farbbegriffen gut übereinstimmt.

Die männlichen und weiblichen Subpopulationen zeigen in der Sprache Cakchiquel (L17 in den WCS-Archiven) unterschiedliche Verhaltensweisen. In Abb. 1, rechtes Feld, können wir sehen, dass die Reihenfolge der Begriffe nach geschlechtsspezifischen Kategoriestärken sehr unterschiedlich ist. Wir werden auf diese Sprache in dem Abschnitt zurückkommen, in dem wir konkrete Unterschiede im männlichen und weiblichen Farbbenennungsverhalten untersuchen.

Um einen globaleren Überblick darüber zu erhalten, wie ähnlich oder unterschiedlich das männliche und weibliche Benennungsverhalten im Allgemeinen sein kann, quantifizieren wir die Unterschiede zwischen TMw,F und TMw,M mithilfe der Funktion Diff (TMw,F, TMw,M) über alle Sprachen und über alle Farbwörter, die in Bezug auf mindestens eines der Geschlechter grundlegend sind. Abbildung 3 zeigt ein Histogramm all dieser Daten. Es ist zu erkennen, dass die meisten Farbwörter zwar ein ähnliches männliches/weibliches Benennungsverhalten aufweisen, dass es aber auch Begriffe gibt, bei denen der Unterschied relativ groß ist; es gibt 19 Farbwörter in 14 Sprachen, bei denen die Diff (TMw,F, TMw,M)-Werte größer als 0,25 sind.

Eine wichtige Frage ist, ob die großen Unterschiede in der Farbkategorisierung, die wir hier erhalten haben, wirklich eine Signatur von Unterschieden im weiblichen und männlichen Verhalten sind. Es ist möglich, dass jede zufällige Aufteilung einer Population in zwei Gruppen zu Unterschieden in der Kategorisierung (oder im Erscheinungsbild der Begriffskarte) führt, die rein zufällig sind. Um die statistische Signifikanz der Ergebnisse in Abb. 3 zu untersuchen, teilten wir jede Population zufällig in zwei Untergruppen auf (die pseudomännliche und die pseudofräuliche Gruppe) und wendeten dieselbe Methode an, um die globale Verteilung der Unterschiede zwischen dem pseudomännlichen und dem pseudofräulichen Benennungsverhalten in jeder Sprache zu ermitteln. Anschließend haben wir die Anzahl der Begriffe gezählt und aufgezeichnet, deren Diff-Wert über 0,25 liegt. Wir haben dies 10.000 Mal gemacht; Abb. 3 zeigt die Verteilung der erhaltenen Zählungen, wobei die Fläche auf 1 Einheit normalisiert wurde.

Nun nehmen wir die folgende Nullhypothese an: „19 oder mehr Fälle mit Diff ≥ 0,25 können durch zufällige Unterteilung jeder Population in zwei Untergruppen erhalten werden“. Man beachte, dass das Histogramm in Abb. 3, wenn es auf eine Flächeneinheit normiert ist, als Wahrscheinlichkeitsverteilung interpretiert werden kann, die die Wahrscheinlichkeit des Auftretens von n High-Diff-Termen angibt. Wenn die Nullhypothese richtig ist, würde der „Schwanz“ des normalisierten Histogramms, der orange hervorgehoben ist, eine Fläche haben, die größer oder gleich 0,05 ist (unter Verwendung des 95%-Cut-off). Dies ist jedoch nicht der Fall – die beobachtete Fläche beträgt etwa 0,0191, was bedeutet, dass ein großer Unterschied im Benennungsverhalten, unter der Annahme, dass die Untergruppen durch eine zufällige Aufteilung der Allgemeinbevölkerung gebildet werden, mit einer sehr geringen Wahrscheinlichkeit auftritt. Daraus lässt sich schließen, dass die bei der Untersuchung von Männern und Frauen beobachteten Unterschiede statistisch signifikant sind.

Die Analyse der 19 Begriffe, die Diff (w) > 0,25 erfüllen, zeigt, dass drei Begriffe aus der Karaja-Sprache (L53 in den WCS-Archiven) stammen: ikura, iura und idy. In Kay et al. (2009) wird darauf hingewiesen, dass die Erhebung von Daten zur Farbbenennung für diese Sprache unregelmäßig war – die Daten wurden in Gruppen und nicht von Individuen erhoben, was dazu führt, dass die Begriffskarten für Individuen, Teilpopulationen und die Gesamtpopulation ungewöhnliche Verteilungen aufweisen. Wir lassen daher diese Sprache aus der Untersuchung aus; beachten Sie, dass das Weglassen von L53 aus allen Simulationsläufen immer noch ein Histogramm mit einer Schwanzgröße von weniger als 0,05 ergibt, was bedeutet, dass der Ausschluss von L53 die Schlussfolgerungen der statistischen Signifikanzanalyse nicht verändert.

Wenn wir uns entschieden hätten, Terme mit Diff (w) > 0,2 zu beobachten, hätten wir 79 Terme im WCS-Datensatz gefunden. Das sind zu viele Terme, um sie in dieser Arbeit im Einzelfall zu untersuchen, obwohl wir in der Diskussion einige besondere Beispiele aus diesem Satz hervorheben. Bei einer zusätzlichen Signifikanzanalyse stellen wir fest, dass weniger als 1 % von 10 000 Begriffen 79 oder mehr Begriffe mit Diff (w) > 0,2 ergeben, so dass wir zu dem Schluss kommen können, dass die Untersuchung dieses Begriffssatzes ebenfalls relevant ist.

Fallstudien: große Unterschiede zwischen weiblichen und männlichen Termkarten

Nachdem wir L53 aus der Untersuchung herausgenommen haben, bleiben 16 Begriffe in 13 Sprachen übrig; detaillierte Informationen zu diesen Sprachen sind in Tabelle 1 enthalten. Im Folgenden werden diese 16 Begriffe von Interesse untersucht. Anhand der Farbkarten der Sprachen, die auf dieser Liste erscheinen, können wir die folgenden Hauptgruppen identifizieren, die durch große Unterschiede zwischen Männern und Frauen gekennzeichnet sind:

Ein Geschlecht lexikalisiert eine Kategorie oder einen Kategoriensplit, das andere Geschlecht nicht (Sprachen 75, 81, 30, 94, 103, 67). Dies könnte darauf zurückzuführen sein, dass ein Geschlecht eine Kategorie vor dem anderen Geschlecht erlernt/erwirbt, und in unseren Fällen mit hohem Unterschied geschieht dies in der Region „grün/blau/grue“ des Farbraums. Konventionell bezieht sich „grue“ auf die Sammlung von Farben, die im Englischen entweder mit blau oder grün beschrieben werden können.
Die Geschlechter lexikalisieren ähnliche Kategorien, haben aber möglicherweise unterschiedliche bevorzugte Namen für die Kategorie. Dies könnte durch muttersprachliche Farbwort-Synonyme (Sprache 103) oder durch entlehnte Farbwörter, die mit vorhandenen muttersprachlichen Farbwörtern konkurrieren, verursacht werden (Sprachen 67, 45, 17). In unseren High-Diff-Fällen sehen wir dies in der Region „violett“ und (ein Beispiel) in der Region „grün/blau/grau“ des Farbraums.
Sonstiges (Sprachen 6, 21, 34, 46, 49).

Tabelle 1 Informationen zu den 13 Sprachen, die als Fallstudien analysiert wurden, geordnet nach der Nummer der zugewiesenen Sprache in der Weltfarbenerhebung

Nachfolgend werden die Fälle näher betrachtet, die auf das Auftreten einer Kategorie im Farbkategorisierungsschema nur eines Geschlechts hinweisen. Insbesondere wird das Farbbenennungsverhalten in den Sprachen Murle, Patep, Colorado, Tboli, Walpiri, Mazahua, Huastec und Cakchiquel hervorgehoben. Die übrigen Large-Diff-Fälle (oben als „andere“ bezeichnet) zeigen kein ungewöhnliches oder interessantes Verhalten, so dass wir sie im ergänzenden Abschnitt 2 behandeln.

Fall 1: Murle (L75)

Die Murle-Sprache hat einen Begriff, nyapus (w11), der einen hohen Diff-Wert hat, siehe die zweite Zeile von Abb. 4. Wir sehen, dass w11 in der weiblichen Teilpopulation gelegentlich den „hellblauen“ Bereich der Farben bezeichnet, während die männliche Teilpopulation w11 überhaupt nicht verwendet. Männliche Sprecher verwenden nur w1, um gräuliche Farben zu bezeichnen. Während die weiblichen Sprecher ebenfalls w1 zur Bezeichnung von Grue-Farben verwenden (die Grue-Kategorie), scheinen die Begriffskarten darauf hinzuweisen, dass die weibliche Teilpopulation eine schwache zusätzliche Kategorie verwendet, die die „hellblauen“ Farben abdeckt und die die männliche Teilpopulation nicht verwendet. Es fällt auch auf, dass die Kategorie „grue“ bei den Frauen in Richtung Grüntöne polarisiert ist, während die Kategorie „grue“ bei den Männern relativ ausgeglichen ist.

Fall 2: Patep (L81)

Die Sprache Patep hat einen Begriff, bilu (w8), der einen hohen Diff-Wert hat, siehe die dritte Zeile von Abb. 5. Wir können sehen, dass w8 am besten den „blauen“ Bereich der Farben bezeichnet. Anhand der Graustufenfärbung der männlichen w8-Kategorie können wir jedoch auch sehen, dass männliche Sprecher w8 nicht oft oder konsequent genug verwenden, um w8 als CSM-Basiswort zu qualifizieren. In der Tat verwenden männliche Sprecher w2, um „blaue“ und „grüne“ Farben zu bezeichnen, und gelegentlich auch w1, um die „grünen“ Farben zu bezeichnen. Weibliche Sprecher trennen die Farbkategorien „grün“ und „blau“ deutlich mit w2 bzw. w8.

Fall 3: Colorado (L30)

Die Colorado-Sprache hat einen Begriff, losimban (w4), der einen hohen Diff-Wert hat, siehe die erste Zeile von Abb. 6. Frauen verwenden w6 zur Bezeichnung von „blau“ und w4 zur Bezeichnung von „grün“. Im Gegensatz dazu verwenden Männer w4 nur selten, um sowohl „grün“ als auch „blau“ zu bezeichnen; w6 wird von der männlichen Bevölkerung recht selten verwendet und scheint dazu zu dienen, die Farben zu bezeichnen, die nicht in eine bekannte Kategorie fallen.

Fall 4: Tboli (L94)

Die Tboli-Sprache hat einen Begriff, gingung (w7), der einen hohen Diff-Wert hat (siehe Abb. 7). Frauen verwenden w7, um „dunkelblau-lila“ zu bezeichnen, während Männer w7 selten verwenden; „dunkelblau-lila“ ist in keiner anderen männlichen Kategorie vertreten.

In den nächsten Fallstudien beobachten wir die Koexistenz konkurrierender Namen für dieselbe Farbkategorie.

Fall 5: Walpiri (L103)

Die Walpiri-Sprache hat einen Terminus, wajirrkikajirrki (w12), der einen hohen Diff-Wert hat, siehe die zweite Zeile von Abb. 8. Bei den Frauen gibt es zwei konkurrierende Wörter, die „grüne“ Farben bezeichnen: w12 und w14. Die Farben „schwarz“ und „blau“ werden durch w7 abgedeckt. Männchen hingegen verwenden w12 nur selten zur Bezeichnung von „grün“, dafür aber w14 (und sehr selten w7) zur Bezeichnung von „grün“. Abgesehen von einer schwachen Präsenz in der Kategorie w7 tauchen „blaue“ Farben in der Nicht-Grundkategorie w10 sowohl bei Männern als auch bei Frauen auf (mit einer höheren Stärke bei Frauen). Walpiri wurde in Lindsey und Brown (2009) näher betrachtet, die fünf Farbbenennungsmotive in dieser Sprache identifizierten; es scheint, dass Geschlechtsunterschiede bei der Farbbenennung zu dieser Vielfalt beitragen.

Fall 6: Mahahua (L67)

Die Mazahua-Sprache hat zwei Begriffe, die hohe Diff-Werte haben: morado und verde. Wir bezeichnen die Wörter als w28 bzw. w47, basierend auf der WCS-Aufzählung. Männliche und weibliche Termkarten für w47 sind in der sechsten Zeile von Abb. 9 dargestellt. Es ist zu erkennen, dass männliche Sprecher w47 fast nie verwenden, um Farben zu bezeichnen, während weibliche Sprecher w47 mit hoher Häufigkeit und Konsistenz verwenden, wenn sie Farben beschreiben, die der englischen Kategorie „grün“ nahe kommen. Dies ist besonders interessant, wenn wir die Termkarten von w4 betrachten, die in der zweiten Zeile von Abb. 9 dargestellt sind. Frauen verwenden w4, um englische „blaue“ Farben zu bezeichnen, während Männer w4 verwenden, um die Kombination von „blauen“ und „grünen“ Farben („grue“) zu bezeichnen. Dies ist also ein Beispiel dafür, dass ein Geschlecht eine große Kategorie lexikalisiert („grue“), während das andere Geschlecht sie in zwei kleinere Kategorien aufteilt („blau“ und „grün“). Männliche und weibliche Termkarten für w28 sind in der fünften Zeile von Abb. 9 dargestellt. w28 wird von Männern und Frauen verwendet, um den Bereich „lila“ der Farben zu bezeichnen. Allerdings verwenden weibliche Sprecher nur w28, um „lila“ zu bezeichnen, während männliche Sprecher auch w7 verwenden, um dieselbe Menge von Farben zu bezeichnen.

Fall 7: Huastec (L45)

Die Huastec-Sprache hat zwei Begriffe, morado und muyaky (w5 und w6), die hohe Diff-Werte haben (siehe Abb. 10). Frauen und Männer verwenden beide Begriffe, um den „violetten“ Bereich der Farben zu bezeichnen. Allerdings bevorzugen weibliche Sprecher w6, während männliche Sprecher w5 bevorzugen. Interessant ist, dass in dieser Sprache die Männer den aus dem Spanischen entlehnten Begriff morado verwenden, während die Frauen das (traditionelle) muyaku benutzen. Dies zeigt ein ähnliches Muster wie das von Samarina (2007) in den Sprachen des Kaukasus gefundene, das durch geschlechtsspezifische Unterschiede im Lebensstil erklärt wird. Frauen, die typischerweise in Praktiken involviert sind, die Aufmerksamkeit für Lebensmittel, Farbstoffe und Pflanzen erfordern, neigen dazu, einheimische, beschreibende Farbbegriffe zu verwenden. Männer hingegen sind in den Handel und andere Aktivitäten außerhalb des häuslichen Umfelds involviert, was dazu führt, dass sie abstraktere, übernommene Farbbegriffe verwenden.

Fall 8: Cakchiquel (L17)

In der Cakchiquel-Sprache gibt es einen Begriff, lila (w16), der einen hohen Diff-Wert hat, siehe die fünfte Zeile von Abb. 11. Frauen verwenden w16, um „helles Violett“ zu bezeichnen; Männer verwenden w16 mit geringerer Häufigkeit und Konsistenz, wenn sie die gleiche Farbpalette beschreiben. Es ist jedoch zu erkennen, dass Frauen w10 zur Bezeichnung von „dunkelvioletten“ Farben verwenden, während Männer w10 zur Bezeichnung aller Farben im „violetten“ Bereich verwenden, einschließlich der hellen und dunklen Varianten.

Männliche und weibliche Kategorieexemplare

In Fider et al. (2017) skizzieren wir Methoden zur Identifizierung und Analyse von Kategorieexemplaren anhand von Daten aus einer Farbbenennungsaufgabe. Bei der Anwendung dieser Methoden auf die weiblichen und männlichen Teilpopulationen stellten wir fest, dass sich männliche und weibliche Exemplare zwar in einigen Sprachen unterschieden, dieses Ergebnis jedoch statistisch nicht signifikant war, da ähnliche Muster in Simulationen mit zufällig ausgewählten pseudomännlichen und pseudofräulichen Populationen beobachtet wurden. Es ist anzumerken, dass der Algorithmus, der das Exemplar einer Kategorie lokalisiert, darauf beruht, den dreidimensionalen Schwerpunkt einer Sammlung von Farben zu finden und ihn auf die WCS-Farbmenge zurückzuprojizieren. Die ursprüngliche Farbsammlung stammt aus dem WCS-Farbsatz, der in erster Linie aus der „Oberfläche“ eines dreidimensionalen Farbkörpers ausgewählt wird; die Berechnung des Massenschwerpunkts und die Rückprojektion auf das WCS-Gitter birgt das Potenzial für Fehler, und die scheinbar zufälligen Ergebnisse für männliche/weibliche Exemplare könnten einfach eine Folge dieses Problems sein. Einzelheiten zu unseren exemplargestützten Methoden und Ergebnissen finden Sie im ergänzenden Abschnitt 4.

Virtual world