Kategoristyrke og termkort
Vi brugte vores metode til at identificere BCT’er for mandlige og kvindelige populationer separat. Plots af termkort er præsenteret i Supplementary Section 7, Figs S7-S97, for alle sprog i WCS med mindst otte mandlige og otte kvindelige respondenter. Hvis man ser på alle farveord på tværs af alle WCS-sprogene, ser det i mange tilfælde ud til, at de mandlige og kvindelige delpopulationer i mange tilfælde anvender samme ordforbrug. Vi er imidlertid interesseret i at undersøge tilfælde, hvor mandlig og kvindelig navngivningsadfærd ser ud til at være meget forskellig. For at illustrere nogle mulige ligheder og forskelle i kategoristyrke mellem hanner og hunner begynder vi med to eksempler. Figur 1 viser de kvindelige og mandlige kategoristyrkeværdier, CSF og CSM, side om side for to WCS sprog.
Den venstre tavle viser kategoriernes styrke med hensyn til de mandlige og kvindelige delpopulationer af Bauzi-sproget (L12 i WCS-arkiverne). Hvert rødt (blåt) punkt repræsenterer et farveord og er plottet i en højde svarende til dets kvindelige (mandlige) kategoristyrke, CSF (CSM)-værdi. Punkter, der svarer til det samme ord, er forbundet med sorte linjer. Af de syv farveord, der anvendes af sprog 12-talere, er fem klassificeret som altid basale farveord (de to aldrig basale farveord har kategoristyrke 0), og selv når de fem ord er opdelt i mandlige og kvindelige undergrupper, er de fem ord altid basale for begge underpopulationer; rækkefølgen af ords kategoristyrke er meget ens hos mænd og kvinder. Populationens termkort for mandlige og kvindelige underpopulationer, som vi betegner TMw,F og TMw,M for hver kategori, der svarer til et ord w, er vist som heatmaps i fig. 2. Hver rektangulær pixel i termkortene repræsenterer en farvechip, der anvendes i WCS, således at pixelerne i termkortene og WCS-gitterchippene er orienteret på samme måde; det fulde WCS-chipset er vist i fig. S1 i supplerende afsnit 1 til reference. Mørkere skravering i termkortet angiver, at de tilsvarende farver er navngivet med ordet wi af en større del af delpopulationen. Hvid farvning i termkortet angiver, at de tilsvarende farver aldrig nævnes med ordet wi. Vi kan se, at de kvindelige og mandlige taleres navngivningsadfærd stemmer nøje overens med alle fem relevante farveudtryk.
De mandlige og kvindelige subpopulationer viser forskellig adfærd i cakchiquel-sproget (L17 i WCS-arkiverne). I fig. 1, højre panel, kan vi se, at ordningerne af termer i henhold til kønsafledte kategoristyrker er meget forskellige. Vi vender tilbage til dette sprog i afsnittet, når vi undersøger konkrete forskelle i mandlig og kvindelig farvenavnsadfærd.
For at få et mere globalt overblik over, hvor generelt ens eller forskellig mandlig og kvindelig navngivningsadfærd kan være, kvantificerer vi forskellene mellem TMw,F og TMw,M ved hjælp af funktionen Diff (TMw,F, TMw,M) på tværs af alle sprog og på tværs af alle farveord, som er grundlæggende med hensyn til mindst et af kønnene. Figur 3 viser et histogram af alle disse data. Vi kan se, at mens de fleste farveord viser en lignende mandlig/kvindelig navngivningsadfærd, er der udtryk, hvor forskellen er relativt stor; der er 19 farveord, der spænder over 14 sprog, som har Diff (TMw,F, TMw,M)-værdier større end 0,25.
Et vigtigt spørgsmål er, om de store forskelle i farvekategorisering, der opnås her, virkelig er en signatur af forskelle i hunner og hanners adfærd. Det er muligt, at enhver tilfældig opdeling af en population i to grupper sandsynligvis vil give nogle forskelle i kategorisering (eller, term-map udseende) bare tilfældigt. For at undersøge den statistiske betydning af resultaterne i fig. 3 opdelte vi tilfældigt hver population i to undergrupper (den pseudomale gruppe og den pseudofemale gruppe) og anvendte den samme metode til at finde den globale fordeling af forskelle mellem pseudomales og pseudofemales navngivningsadfærd på hvert sprog. Vi talte og registrerede derefter antallet af udtryk, der har en Diff-værdi over 0,25. Vi gjorde dette 10 000 gange; fig. 3 viser den opnåede fordeling af tællinger, hvor arealet er normaliseret til at være lig med 1 enhed.
Nu antages følgende nulhypotese: “19 eller flere tilfælde med Diff ≥ 0,25 kan opnås ved tilfældig opdeling af hver population i to undergrupper”. Bemærk, at histogrammet i fig. 3, når det er normaliseret til at have et enhedsareal, kan fortolkes som en sandsynlighedsfordeling, der viser sandsynligheden for, at der forekommer n termer med høj Diff. Hvis nulhypotesen er korrekt, vil “halen” af det normaliserede histogram, der er fremhævet med orange, have et areal større end eller lig med 0,05 (ved hjælp af 95%-grænsen). Dette er imidlertid ikke tilfældet – det observerede område er ca. 0,0191, hvilket indebærer, at en stor grad af forskel i navngivningsadfærd, hvis man antager, at undergrupper er dannet ved tilfældig opdeling af den generelle befolkning, forekommer med en meget lille sandsynlighed. Vi kan derfor konkludere, at de forskelle, der observeres ved at studere mænd og kvinder, er statistisk signifikante.
Analyse af de 19 termer, der opfylder Diff (w) > 0,25, afslører, at tre termer stammer fra karaja-sproget (L53 i WCS-arkiverne): ikura, iura og idy. Det bemærkes i Kay et al. (2009), at indsamlingen af data om farvenavne var uregelmæssig for dette sprog – data blev indsamlet i grupper i stedet for fra enkeltpersoner, hvilket medfører, at de individuelle, subpopulations- og fuldpopulations-terminkort viser usædvanlige fordelinger. Vi udelader derfor dette sprog fra undersøgelsen; bemærk, at udeladelse af L53 fra alle simuleringskørsler stadig giver et histogram med halestørrelse mindre end 0,05, hvilket betyder, at udelukkelse af L53 ikke ændrer konklusionerne af den statistiske signifikansanalyse.
Hvis vi havde valgt at observere termer med Diff (w) > 0,2, ville vi have fundet 79 termer i WCS-datasættet. Dette er for mange termer til at blive undersøgt fra sag til sag i dette dokument, selv om vi fremhæver nogle særlige eksempler fra dette sæt i diskussionen. Ved at udføre yderligere signifikansanalyse finder vi, at mindre end 1 % af i 10.000 giver 79 eller flere termer med Diff (w) > 0,2, så vi kan konkludere, at undersøgelsen af dette sæt termer også er relevant.
Casestudier: store forskelle mellem kvindelige og mandlige termkort
Når vi har fjernet L53 fra undersøgelsen, er vi tilbage med 16 ord på tværs af 13 sprog; detaljerede oplysninger om disse sprog findes i tabel 1. Nedenfor undersøger vi disse 16 termer af interesse. I betragtning af farvekortene for de sprog, der optræder på denne liste, kan vi identificere følgende hovedgrupper, der er bestemt af store forskelle mellem mænd og kvinder:
-
Et køn leksikaliserer en kategori eller en kategoriopdeling, og det andet køn gør det ikke (sprog 75, 81, 30, 94, 103, 67). Dette kan skyldes, at det ene køn lærer/erhverver en kategori før det andet køn, og i vores tilfælde med høj forskel sker dette i “grøn/blå/grue”-området i farverummet. Konventionelt henviser “grue” til den samling af farver, der på engelsk kan beskrives med enten blå eller grøn.
-
Kønnene leksikaliserer lignende kategorier, men kan have forskellige foretrukne navne for kategorien. Dette kan skyldes indfødte farveord-synonymer (sprog 103) eller lånte farveord, som konkurrerer med eksisterende indfødte farveord (sprog 67, 45, 17). I vores tilfælde med stor forskel ser vi dette forekomme i området “lilla” og (et eksempel) i området “grøn/blå/grue” i farverummet.
-
Andre (sprog 6, 21, 34, 46, 49).
Nedenfor ser vi nærmere på de tilfælde, der indikerer fremkomsten af en kategori i kun ét køns farvekategoriseringsskema. Specifikt fremhæver vi den farvenævnelsesadfærd, som Murle-, Patep-, Colorado-, Tboli-, Walpiri-, Mazahua-, Huastec- og Cakchiquel-sprogene udviser. De resterende tilfælde med stor Diff (ovenfor benævnt “andre”) udviser ikke usædvanlig eller interessant adfærd, så vi behandler dem i supplerende afsnit 2.
Fald 1: Murle (L75)
Murle-sproget har ét udtryk, nyapus (w11), som har en høj Diff-værdi, jf. anden række i fig. 4. Vi kan se, at ifølge den kvindelige delpopulation betegner w11 lejlighedsvis det “lyseblå” område af farver, mens den mandlige delpopulation slet ikke bruger w11. Mandlige talere bruger kun w1 til at betegne gruefarver. Mens hunnerne også bruger w1 til at betegne grue-farver (grue-kategorien), synes termerkortet at indikere, at den kvindelige delpopulation har brugt en svag ekstra kategori, der dækker de “lyseblå” farver, som den mandlige delpopulation ikke bruger. Vi bemærker også, at grue-kategorien for hunnerne er polariseret i retning af de grønne nuancer, mens den mandlige “grue” er relativt afbalanceret.
Fald 2: Patep (L81)
Patep-sproget har ét udtryk, bilu (w8), som har en høj Diff-værdi, se den tredje række i fig. 5. Vi kan se, at w8 bedst betegner den “blå” region af farver. Vi kan dog også se på gråskalafarven i den mandlige w8-kategori, at mandlige talere ikke bruger w8 ofte nok eller konsekvent nok til at kvalificere w8 som CSM-basisk. Faktisk brugte mandlige talere w2 til at betegne “blå” og “grønne” farver, og de bruger også lejlighedsvis w1 til at betegne de “grønne” farver. Kvindelige talere adskilte de “grønne” og “blå” farvekategorier tydeligt med henholdsvis w2 og w8.
Fald 3: Colorado (L30)
Colorado-sproget har ét udtryk, losimban (w4), som har en høj Diff-værdi, se den første række i fig. 6. Hunnerne bruger w6 til at betegne “blå” og w4 til at betegne “grøn”. Derimod bruger mænd sjældent w4 til at betegne både “grønne” og “blå” farver; w6 bruges ret sjældent af den mandlige befolkning og synes at blive brugt til at betegne de farver, som ikke falder ind under en kendt kategori.
Fald 4: Tboli (L94)
Tboli-sproget har ét begreb, gingung (w7), som har en høj Diff-værdi (se fig. 7). Hunnerne bruger w7 til at betegne “mørkeblå-lilla”, mens mændene sjældent bruger w7; “mørkeblå-lilla” farver er ikke repræsenteret i nogen anden mandlig kategori.
I de næste casestudier observerer vi sameksistensen af konkurrerende navne for den samme farvekategori.
Fald 5: Walpiri (L103)
Sproget Walpiri har ét term, wajirrkikajirrki (w12), som har en høj Diff-værdi, jf. anden række i fig. 8. Hunnerne har to konkurrerende ord, som betegner “grønne” farver: w12 og w14. De “sorte” og “blå” farver er dækket af w7. På den anden side bruger hanner sjældent w12 til at betegne “grøn”, men bruger w14 (og meget lejlighedsvis w7) til at betegne “grøn”. Bortset fra en svag tilstedeværelse i w7-kategorien forekommer “blå” farver i den ikke grundlæggende kategori w10 for både hanner og hunner (med en højere styrke for hunnerne). Walpiri blev behandlet ret detaljeret i Lindsey og Brown (2009), som identificerede eksistensen af fem farvenavnsmotiver i dette sprog; det ser ud til, at kønsforskelle i farvenavn bidrager til denne mangfoldighed.
Fald 6: Mahahua (L67)
Mazahua sproget har to udtryk, som har høje Diff værdier: morado, og verde. Vi betegner ordene som henholdsvis w28 og w47, baseret på WCS-opregningen. Mandlige og kvindelige termkort for w47 er vist i den sjette række i fig. 9. Vi kan se, at mandlige talere næsten aldrig bruger w47 til at betegne nogen farver, mens kvindelige talere bruger w47 med høj frekvens og konsistens, når de beskriver farver, der nærmer sig den engelske “green”-kategori. Dette er især interessant, når vi betragter termkortet for w4, som vises i anden række i fig. 9. Hunnerne bruger w4 til at betegne engelske “blå” farver, mens hannerne bruger w4 til at betegne kombinationen af “blå” og “grønne” farver (“grue”). Der er derfor tale om et eksempel, hvor det ene køn leksikaliserer en stor kategori (“grue”), mens det andet køn opdeler den i to mindre kategorier (“blå” og “grøn”). Mandlige og kvindelige termkort for w28 er vist i den femte række i fig. 9. w28 bruges af mænd og kvinder til at betegne den “lilla” region af farver. Kvindelige talere bruger dog kun w28 til at betegne “lilla”, mens mandlige talere også bruger w7 til at betegne det samme sæt af farver.
Fald 7: Huastec (L45)
Huastec-sproget har to udtryk, morado og muyaky (w5 og w6), som har høje Diff-værdier (se fig. 10). Hunner og mænd bruger begge udtryk til at betegne den “lilla” region af farver. Dog foretrækker kvindelige talere w6, mens mandlige talere foretrækker w5. Det er interessant, at i dette sprog bruger mændene udtrykket morado, der er lånt fra spansk, mens kvinderne bruger det (traditionelle) muyaku. Dette viser et mønster, der ligner det, som Samarina (2007) har fundet i sprog i Kaukasus, og som forklares med kønsforskelle i livsstilen. Kvinder, som typisk er involveret i praksis, der kræver opmærksomhed på fødevarer, farvestoffer og planter, har en tendens til at bruge indfødte, beskrivende farveudtryk. Mænd derimod bliver involveret i handel og andre aktiviteter uden for det hjemlige miljø, hvilket fører til, at de bruger mere abstrakte, adopterede farveudtryk.
Fald 8: Cakchiquel (L17)
Cakchiquel-sproget har ét udtryk, lila (w16), som har en høj Diff-værdi, se den femte række i fig. 11. Hunnerne bruger w16 til at betegne “lyslilla”; hannerne bruger w16 med mindre hyppighed og konsistens, når de beskriver det samme sæt af farver. Vi kan imidlertid se, at mens hunnerne bruger w10 til at betegne “mørk lilla” farver, bruger hannerne w10 til at betegne alle farver i “lilla” området, herunder de lyse og mørke varianter.
Hanlige og kvindelige kategorieksempler
I Fider et al. (2017) skitserer vi metoder til at identificere og analysere kategorieksempler i henhold til data fra en farvenavneopgave. Ved at anvende disse metoder på de kvindelige og mandlige delpopulationer fandt vi, at selv om mandlige og kvindelige eksemplarer i nogle sprog var forskellige, var dette resultat ikke statistisk signifikant i den forstand, at lignende mønstre blev observeret i simuleringer med tilfældigt udvalgte pseudomale og pseudofemale populationer. Det skal bemærkes, at den algoritme, der lokaliserer eksemplaret for en kategori, afhænger af at finde den tredimensionale centroid for en samling af farver og projicere den tilbage på WCS-farvesættet. Den oprindelige samling af farver stammer fra WCS-farvesættet, som primært er valgt fra “overfladen” af et tredimensionalt farvesolid; beregning af massemidtpunktet og tilbageprojektion på WCS-gitteret introducerer et fejlpotentiale, og de tilsyneladende tilfældige mandlige/kvindelige eksemplarresultater kan simpelthen være en konsekvens af dette problem. Nærmere oplysninger om vores eksemplarbaserede metoder og resultater kan findes i supplerende afsnit 4.