Differences in color categorization manifested by males and females: a quantitative World Color Survey study

Category strength and term maps

Użyliśmy naszej metodologii do identyfikacji BCTs osobno dla męskiej i żeńskiej populacji. Wykresy map terminów są przedstawione w Supplementary Section 7, Figs S7-S97, dla wszystkich języków w WCS z co najmniej ośmioma respondentami płci męskiej i ośmioma płci żeńskiej. Biorąc pod uwagę wszystkie kolorowe słowa we wszystkich językach WCS, w wielu przypadkach subpopulacje męskie i żeńskie wydają się wykorzystywać podobny zasób słów. Jednakże jesteśmy zainteresowani badaniem przypadków, w których męskie i żeńskie zachowania nazewnicze wydają się być bardzo różne. Aby zilustrować niektóre możliwe podobieństwa i różnice w sile kategorii między samcami i samicami, zaczniemy od dwóch przykładów. Rysunek 1 pokazuje żeńskie i męskie wartości siły kategorii, CSF i CSM, obok siebie dla dwóch języków WCS.

Rys. 1

Wizualizacja siły kategorii. a pokazuje dane dla języka 12, b pokazuje dane dla języka 17. Na każdym rysunku, każde kolorowe słowo w języka jest wykreślone na niebiesko na wysokości CSM(w), a na czerwono na wysokości CSF(w). Linie łączą męskie i żeńskie wyniki dla słowa w. Punkty, które mieszczą się w żółtym obszarze każdego wykresu, odpowiadają potencjalnie podstawowym słowom koloru; punkty powyżej odpowiadają zawsze podstawowym słowom koloru, a punkty poniżej odpowiadają nigdy niepodstawowym słowom koloru

Lewy panel pokazuje mocne strony kategorii w odniesieniu do męskiej i żeńskiej subpopulacji języka Bauzi (L12 w archiwach WCS). Każdy czerwony (niebieski) punkt reprezentuje kolorowe słowo i jest wykreślony na wysokości odpowiadającej jego żeńskiej (męskiej) sile kategorii, wartości CSF (CSM). Punkty, które odpowiadają temu samemu słowu są połączone czarnymi liniami. Spośród siedmiu kolorowych słów używanych przez użytkowników języka 12, pięć jest sklasyfikowanych jako zawsze-podstawowe (dwa nigdy-podstawowe mają siłę kategorii 0), i nawet po rozdzieleniu na podgrupy męskie i żeńskie, te pięć słów jest zawsze-podstawowych w odniesieniu do obu subpopulacji; uporządkowanie siły kategorii terminów jest bardzo podobne u mężczyzn i kobiet. Populacyjne mapy pojęć dla subpopulacji męskiej i żeńskiej, które oznaczamy TMw,F i TMw,M dla każdej kategorii odpowiadającej słowu w, są przedstawione jako mapy cieplne na Rys. 2. Każdy prostokątny piksel na mapach terminów reprezentuje kolorowy chip używany w WCS, tak że piksele na mapach terminów i chipy siatki WCS są zorientowane w ten sam sposób; pełny zestaw chipów WCS jest pokazany na Rys. S1 w Supplementary Section 1 dla odniesienia. Ciemniejsze cieniowanie w mapach pojęć wskazuje, że odpowiadające im kolory są nazwane słowem wi przez większą frakcję subpopulacji. Biały kolor na mapach pojęć wskazuje, że odpowiadające im kolory nigdy nie są nazywane słowem wi. Widzimy, że zachowania nazewnicze mówców płci żeńskiej i męskiej ściśle odpowiadają wszystkim pięciu istotnym terminom kolorystycznym.

Rys. 2

Mapy terminów subpopulacji języka 12 dla danych rozdzielonych ze względu na płeć. Każdy rząd odpowiada słowu, przy czym lewy panel pokazuje mapę terminów żeńskich, a prawy – męskich

Subpopulacje męskie i żeńskie wykazują różne zachowania w języku Cakchiquel (L17 w archiwum WCS). Na Rys. 1, prawy panel, widzimy, że uporządkowanie terminów według siły kategorii zależnej od płci jest bardzo różne. Wrócimy do tego języka w rozdziale, w którym będziemy badać konkretne różnice w męskim i żeńskim nazewnictwie kolorów.

Aby uzyskać bardziej globalny pogląd na to, jak generalnie podobne lub różne mogą być męskie i żeńskie zachowania nazewnicze, określamy ilościowo różnice między TMw,F i TMw,M używając funkcji Diff (TMw,F, TMw,M) we wszystkich językach i we wszystkich słowach kolorów, które są podstawowe w odniesieniu do przynajmniej jednej z płci. Rysunek 3 pokazuje histogram wszystkich tych danych. Widzimy, że podczas gdy większość kolorowych terminów wykazuje podobne zachowanie w nazewnictwie męskim/żeńskim, istnieją terminy, w których różnica jest stosunkowo duża; jest 19 kolorowych słów, obejmujących 14 języków, które mają wartości Diff (TMw,F, TMw,M) większe niż 0.25.

Fig. 3

Realne i symulowane dane Diff. a Histogram rozkładu wartości Diff. b Histogram przedstawiający liczbę przypadków z Diff ≥ 0,25 (oś niehoryzontalna), dla losowego podziału populacji na pseudofeminów i pseudomężczyzn (znormalizowanych tak, by miały jednostkową powierzchnię). Ogon, zaznaczony na pomarańczowo, reprezentuje procent iteracji, które miały 19 lub więcej takich „interesujących przypadków”

Ważnym pytaniem jest, czy uzyskane tu duże różnice w kategoryzacji kolorów są rzeczywiście sygnaturą różnic w zachowaniu samic i samców. It may be possible that any random splitting of a population in two groups is likely to give some differences in categorization (or, term-map appearance) just by chance. Aby zbadać statystyczne znaczenie wyników z Rys. 3, podzieliliśmy losowo każdą populację na dwie podgrupy (grupę pseudomałżeńską i grupę pseudofeministyczną) i zastosowaliśmy tę samą metodologię, by znaleźć globalny rozkład różnic między pseudomałymi i pseudofeministycznymi zachowaniami nazewniczymi dla każdego języka. Następnie policzyliśmy i zapisaliśmy liczbę terminów, które mają wartość Diff powyżej 0,25. Zrobiliśmy to 10 000 razy; Rys. 3 pokazuje rozkład uzyskanych zliczeń, z obszarem znormalizowanym do równej 1 jednostki.

Załóżmy teraz następującą hipotezę zerową: „19 lub więcej przypadków z Diff ≥ 0.25 można uzyskać przez losowe podzielenie każdej populacji na dwie podgrupy”. Zauważmy, że po znormalizowaniu do jednostkowej powierzchni, histogram na Rys. 3 może być interpretowany jako rozkład prawdopodobieństwa, który pokazuje prawdopodobieństwo pojawienia się n terminów o wysokim Diff. Jeśli hipoteza zerowa jest poprawna, „ogon” znormalizowanego histogramu, zaznaczony na pomarańczowo, miałby pole powierzchni większe lub równe 0,05 (przy użyciu 95% punktu odcięcia). Tak się jednak nie dzieje – obserwowany obszar wynosi około 0,0191, co sugeruje, że duży stopień różnic w zachowaniach związanych z nadawaniem nazw, przy założeniu, że podgrupy są tworzone przez losowy podział populacji ogólnej, występuje z bardzo małym prawdopodobieństwem. Możemy zatem stwierdzić, że różnice zaobserwowane przy badaniu mężczyzn i kobiet są statystycznie istotne.

Analiza 19 terminów spełniających Diff (w) > 0,25 ujawnia, że trzy terminy pochodzą z języka karaja (L53 w archiwum WCS): ikura, iura oraz idy. W Kay et al. (2009) zauważono, że zbieranie danych o nazewnictwie barw było nieregularne dla tego języka – dane były zbierane w grupach, a nie od osobników, co powoduje, że indywidualne, subpopulacyjne i pełnopopulacyjne mapy terminów wykazują nietypowe rozkłady. Dlatego pomijamy ten język w badaniach; zauważ, że pominięcie L53 ze wszystkich przebiegów symulacji nadal daje histogram z wielkością ogona mniejszą niż 0,05, co oznacza, że wykluczenie L53 nie zmienia wniosków z analizy istotności statystycznej.

Gdybyśmy wybrali obserwację terminów z Diff (w) > 0,2, znaleźlibyśmy 79 terminów w zbiorze danych WCS. Jest to zbyt wiele terminów, aby badać je indywidualnie w tym artykule, chociaż podkreślamy kilka szczególnych przykładów z tego zbioru w Dyskusji. Przeprowadzając dodatkową analizę istotności, stwierdzamy, że mniej niż 1% na 10 000 daje 79 lub więcej terminów z Diff (w) > 0,2, więc możemy stwierdzić, że badanie tego zestawu terminów jest również istotne.

Studia przypadków: duże różnice między mapami terminów kobiet i mężczyzn

Po usunięciu L53 z badania, pozostało nam 16 słów w 13 językach; szczegółowe informacje dla tych języków są podane w Tabeli 1. Poniżej badamy te 16 interesujących nas terminów. Biorąc pod uwagę kolorowe mapy języków, które pojawiają się na tej liście, możemy zidentyfikować następujące kluczowe grupy zdeterminowane przez duże różnice między mężczyznami i kobietami:

  • Jedna płeć leksykalizuje kategorię lub podział kategorii, a druga płeć nie (języki 75, 81, 30, 94, 103, 67). Może to być spowodowane tym, że jedna płeć uczy się/ nabywa kategorię przed drugą płcią, a w naszych przypadkach High-Diff dzieje się to w regionie „green/blue/grue” przestrzeni barw. Konwencjonalnie, „grue” odnosi się do zbioru kolorów, które mogą być opisane w języku angielskim przez niebieski lub zielony.

  • Płcie leksykalizują podobne kategorie, ale mogą mieć różne preferowane nazwy dla kategorii. Może to być spowodowane przez rodzime synonimy słowa-koloru (język 103), lub zapożyczone słowa-kolory, które konkurują z istniejącymi rodzimymi słowami-kolorami (języki 67, 45, 17). W naszych przypadkach High-Diff, widzimy to w regionie „purpurowy” i (jeden przykład) w regionie „zielony/niebieski/grue” przestrzeni kolorów.

  • Inne (języki 6, 21, 34, 46, 49).

Tabela 1 Informacje o 13 językach analizowanych jako studia przypadku, uporządkowanych według przypisanego numeru języka badania kolorów świata

Poniżej rozważamy bardziej szczegółowo przypadki, które wskazują na pojawienie się kategorii w schemacie kategoryzacji kolorów tylko jednej płci. W szczególności podkreślamy zachowania związane z nadawaniem nazw kolorom w językach Murle, Patep, Colorado, Tboli, Walpiri, Mazahua, Huastec i Cakchiquel. Pozostałe przypadki dużego rozróżnienia (określane jako „inne” powyżej) nie wykazują niezwykłego lub interesującego zachowania, więc zajmujemy się nimi w Uzupełniającej Sekcji 2.

Przypadek 1: Murle (L75)

Język Murle ma jeden termin, nyapus (w11), który ma wysoką wartość Diff, zobacz drugi rząd Rys. 4. Widzimy, że zgodnie z subpopulacją żeńską, w11 czasami oznacza „jasnoniebieski” region kolorów, podczas gdy subpopulacja męska nie używa w11 w ogóle. Mężczyźni używają tylko w1 do oznaczania kolorów grue. Podczas gdy samice również używają w1 do oznaczania kolorów grue (kategoria grue), mapy terminów wydają się wskazywać, że subpopulacja żeńska używała słabej dodatkowej kategorii obejmującej kolory „jasnoniebieskie”, której subpopulacja męska nie używa. Zauważamy również, że kategoria grue dla samic jest spolaryzowana w kierunku odcieni zieleni, podczas gdy kategoria grue dla samców jest stosunkowo zrównoważona.

Rys. 4

Wybrane kategorie z języka 75. Tutaj i poniżej, szare kolorowe mapy wskazują nigdy-podstawowość kategorii

Przypadek 2: Patep (L81)

Język Patep ma jeden termin, bilu (w8), który ma wysoką wartość Diff, patrz trzeci rząd Rys. 5. Widzimy, że w8 najlepiej wyznacza „niebieski” region kolorów. Jednakże, możemy również zauważyć na podstawie kolorystyki w skali szarości męskiej kategorii w8, że męscy mówcy nie używają w8 wystarczająco często lub konsekwentnie, aby zakwalifikować w8 jako podstawowy CSM. Istotnie, męscy mówcy używają w2 do oznaczania kolorów „niebieskiego” i „zielonego”, a także sporadycznie używają w1 do oznaczania kolorów „zielonych”. Kobiety wyraźnie oddzielają kategorie kolorów „zielonego” i „niebieskiego”, odpowiednio za pomocą w2 i w8.

Fig. 5

Wybrane kategorie z języka 81

Przypadek 3: Kolorado (L30)

Język Kolorado ma jeden termin, losimban (w4), który ma wysoką wartość Diff, patrz pierwszy rząd Rys. 6. Kobiety używają w6 do oznaczenia „niebieski” i w4 do oznaczenia „zielony”. W przeciwieństwie do tego, mężczyźni rzadko używają w4 do oznaczania zarówno „zielonych” jak i „niebieskich” kolorów; w6 jest używany dość rzadko przez męską populację i wydaje się być używany do oznaczania kolorów, które nie należą do znanej kategorii.

Fig. 6

Wybrane kategorie z języka 30

Przypadek 4: Tboli (L94)

Język Tboli ma jeden termin, gingung (w7), który ma wysoką wartość Diff (patrz Rys. 7). Kobiety używają w7 do oznaczenia „ciemnoniebiesko-fioletowego”, podczas gdy mężczyźni rzadko używają w7; kolory „ciemnoniebiesko-fioletowe” nie są reprezentowane w żadnej innej kategorii męskiej.

Ryc. 7

Wybrana kategoria z języka 94. Mapy terminów żeńskich i męskich, odpowiednio, odpowiadające terminowi kolorystycznemu w7

W kolejnych studiach przypadku obserwujemy współistnienie konkurencyjnych nazw dla tej samej kategorii kolorystycznej.

Przypadek 5: Walpiri (L103)

Język Walpiri ma jeden termin, wajirrkikajirrki (w12), który ma wysoką wartość Diff, patrz drugi rząd Rys. 8. Samice mają dwa konkurencyjne słowa, które oznaczają „zielone” kolory: w12 i w14. Kolory „czarny” i „niebieski” są pokrywane przez w7. Z drugiej strony, samce rzadko używają w12 na oznaczenie „zielonego”, ale używają w14 (i bardzo sporadycznie w7) na oznaczenie „zielonego”. Poza słabą obecnością w kategorii w7, kolory „niebieskie” pojawiają się w kategorii niepodstawowej w10 zarówno dla samców, jak i samic (z większą siłą dla samic). Walpiri zostało szczegółowo przeanalizowane przez Lindsey i Brown (2009), którzy zidentyfikowali istnienie pięciu motywów nazewnictwa kolorów w tym języku; wydaje się, że różnice płci w nazewnictwie kolorów przyczyniają się do tej różnorodności.

Rys. 8

Wybrane kategorie z języka 103

Przypadek 6: Mahahua (L67)

Język Mazahua ma dwa terminy, które mają wysoką wartość Diff: morado, i verde. Odnosimy się do tych słów, odpowiednio, jako w28 i w47, w oparciu o wyliczenia WCS. Męskie i żeńskie mapy terminów dla w47 pokazane są w szóstym rzędzie Rys. 9. Widzimy, że męscy użytkownicy języka prawie nigdy nie używają w47 do oznaczania jakichkolwiek kolorów, podczas gdy żeńscy używają w47 z dużą częstotliwością i konsekwencją do opisywania kolorów, które są zbliżone do angielskiej kategorii „zielony”. Jest to szczególnie interesujące, gdy weźmiemy pod uwagę mapy terminów dla w4, pokazane w drugim rzędzie Rys. 9. Kobiety używają w4 do oznaczania angielskich kolorów „niebieskich”, podczas gdy mężczyźni używają w4 do oznaczania kombinacji kolorów „niebieskiego” i „zielonego” („grue”). Jest to zatem przykład, w którym jedna płeć leksykalizuje dużą kategorię („grue”), podczas gdy druga dzieli ją na dwie mniejsze kategorie („niebieski” i „zielony”). Męskie i żeńskie mapy terminów dla w28 są pokazane w piątym rzędzie Rys. 9. w28 jest używane przez mężczyzn i kobiety do oznaczania „fioletowego” obszaru kolorów. Jednak kobiety używają tylko w28 do oznaczania „purpury”, podczas gdy mężczyźni również używają w7 do oznaczania tego samego zestawu kolorów.

Ryc. 9

Wybrane kategorie z języka 67

Przypadek 7: Huastec (L45)

Język Huastec ma dwa terminy, morado i muyaky (w5 i w6), które mają wysokie wartości Diff (patrz Rys. 10). Zarówno kobiety, jak i mężczyźni używają obu terminów do oznaczania „purpurowego” regionu kolorów. Jednakże, kobiety używają w6, podczas gdy mężczyźni w5. Interesujące jest, że w tym języku mężczyźni używają terminu morado, zapożyczonego z hiszpańskiego, podczas gdy kobiety używają (tradycyjnego) muyaku. Pokazuje to wzór podobny do tego, jaki Samarina (2007) znalazła w językach Kaukazu, co tłumaczy się różnicami w stylu życia kobiet i mężczyzn. Kobiety, które są zazwyczaj zaangażowane w praktyki wymagające uwagi do żywności, barwników i roślin, mają tendencję do używania rdzennych, opisowych określeń kolorów. Z kolei mężczyźni angażują się w handel i inne działania wykraczające poza środowisko domowe, co prowadzi do używania przez nich bardziej abstrakcyjnych, adoptowanych terminów kolorystycznych.

Fig. 10

Wybrane kategorie z języka 45

Przypadek 8: Cakchiquel (L17)

Język Cakchiquel ma jeden termin, lila (w16), który ma wysoką wartość Diff, patrz piąty rząd Rys. 11. Kobiety używają w16 do określenia „jasnego fioletu”; mężczyźni używają w16 z mniejszą częstotliwością i konsekwencją przy opisie tego samego zestawu kolorów. Można jednak zauważyć, że podczas gdy samice używają w10 do oznaczania kolorów „ciemnofioletowych”, samce używają w10 do oznaczania wszystkich kolorów w regionie „fioletowym”, w tym odmian jasnych i ciemnych.

Fig. 11

Wybrane kategorie z języka 17

Męskie i żeńskie egzemplifikacje kategorii

W Fider et al. (2017) nakreśliliśmy metody identyfikacji i analizy egzemplifikacji kategorii według danych z zadania nazywania kolorów. Stosując te metody do subpopulacji żeńskich i męskich, stwierdziliśmy, że choć w niektórych językach męskie i żeńskie egzemplaże różniły się od siebie, wynik ten nie był statystycznie istotny, w tym sensie, że podobne wzorce zaobserwowano w symulacjach z losowo wybranymi populacjami pseudomęskimi i pseudofeministycznymi. Należy zauważyć, że algorytm lokalizujący egzemplifikację danej kategorii polega na znalezieniu trójwymiarowego centroidu zbioru kolorów i rzutowaniu go z powrotem na zbiór kolorów WCS. Oryginalna kolekcja kolorów pochodzi z zestawu kolorów WCS, który jest wybierany głównie z „powierzchni” trójwymiarowej bryły koloru; obliczanie środka masy i rzutowanie z powrotem na siatkę WCS wprowadza potencjał błędu, a pozornie losowe wyniki wzorców męskich/żeńskich mogą być po prostu konsekwencją tego problemu. Szczegóły dotyczące naszych metod i wyników opartych na przykładach można znaleźć w Uzupełniającej Sekcji 4.

.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.