- Kategoristyrka och termkartor
- Fallstudier: stora skillnader mellan kvinnliga och manliga termkartor
- Fall 1: Murle (L75)
- Fall 2: Patep (L81)
- Fall 3: Colorado (L30)
- Fall 4: Tboli (L94)
- Fall 5: Walpiri (L103)
- Fall 6: Mahahua (L67)
- Fall 7: Huastec (L45)
- Fall 8: Cakchiquel (L17)
- Manliga och kvinnliga kategoriexemplar
Kategoristyrka och termkartor
Vi använde vår metodik för att identifiera BCT:er för manliga och kvinnliga populationer separat. Plottar av termkartor presenteras i tilläggsavsnitt 7, figurerna S7-S97, för alla språk i WCS med minst åtta manliga och åtta kvinnliga respondenter. Om man tar hänsyn till alla färgord i alla WCS-språken verkar de manliga och kvinnliga delpopulationerna i många fall använda liknande ordanvändning. Vi är dock intresserade av att studera fall där manliga och kvinnliga namngivningsbeteenden tycks vara mycket olika. För att illustrera några möjliga likheter och skillnader i kategoristyrka mellan män och kvinnor börjar vi med två exempel. Figur 1 visar de kvinnliga och manliga värdena för kategoristyrka, CSF och CSM, sida vid sida för två WCS-språk.
Den vänstra panelen visar kategoriernas styrkor med avseende på manliga och kvinnliga subpopulationer av Bauzi-språket (L12 i WCS-arkivet). Varje röd (blå) punkt representerar ett färgord och är ritad på en höjd som motsvarar dess kvinnliga (manliga) kategoristyrka, CSF (CSM)-värde. Punkter som motsvarar samma ord är sammanlänkade med svarta linjer. Av de sju färgord som används av talare i språk 12 klassificeras fem som alltid grundläggande färgtermer (de två aldrig grundläggande färgtermerna har kategoristyrka 0), och även när de delas upp i manliga och kvinnliga undergrupper är de fem orden alltid grundläggande med avseende på båda underpopulationerna; ordningsföljden för termernas kategoristyrka är mycket likartad hos män och kvinnor. Populationens termkartor för manliga och kvinnliga subpopulationer, som vi betecknar TMw,F och TMw,M för varje kategori som motsvarar ett ord w, visas som värmekartor i fig. 2. Varje rektangulär pixel i termkartorna representerar ett färgchip som används i WCS, så att pixlarna i termkartorna och WCS-gitterchipsen är orienterade på samma sätt; den fullständiga WCS-chipuppsättningen visas i fig. S1 i tilläggsavsnitt 1 som referens. Mörkare skuggning i termkartorna indikerar att motsvarande färger benämns med ordet wi av en större andel av subpopulationen. Vit färgning i termkartorna visar att motsvarande färger aldrig benämns med ordet wi. Vi kan se att namngivningsbeteendet hos kvinnliga och manliga talare stämmer väl överens för alla fem relevanta färgtermer.
De manliga och kvinnliga subpopulationerna uppvisar olika beteenden i cakchiquelspråket (L17 i WCS-arkivet). I fig. 1, högra panelen, kan vi se att ordningarna av termer enligt könsrelaterade kategoristyrkor är mycket olika. Vi återkommer till detta språk i avsnittet när vi undersöker konkreta skillnader i manligt och kvinnligt färgbenämningsbeteende.
För att få en mer övergripande bild av hur generellt likartade eller olika manliga och kvinnliga benämningsbeteenden kan vara kvantifierar vi skillnaderna mellan TMw,F och TMw,M med hjälp av funktionen Diff (TMw,F, TMw,M) över alla språk och över alla färgord som är basala med avseende på minst ett av könen. Figur 3 visar ett histogram av alla dessa uppgifter. Vi kan se att även om de flesta färgtermer uppvisar ett liknande namngivningsbeteende för män och kvinnor finns det termer där skillnaden är relativt stor; det finns 19 färgord, som sträcker sig över 14 språk, som har Diff (TMw,F, TMw,M)-värden som är större än 0,25.
En viktig fråga är om de stora skillnaderna i färgkategorisering som erhålls här verkligen är en signatur av skillnader i kvinnors och mäns beteende. Det kan vara möjligt att varje slumpmässig uppdelning av en population i två grupper sannolikt ger vissa skillnader i kategorisering (eller, term-map utseende) bara av en slump. För att studera den statistiska betydelsen av resultaten i figur 3 delade vi slumpmässigt upp varje population i två undergrupper (pseudomale-gruppen och pseudofemale-gruppen) och tillämpade samma metodik för att hitta den globala fördelningen av skillnaderna mellan pseudomale- och pseudofemale-namngivningsbeteendena för varje språk. Vi räknade och noterade sedan antalet termer som har Diff-värde över 0,25. Vi gjorde detta 10 000 gånger; fig. 3 visar den erhållna fördelningen av antalet antal, med ytan normaliserad till att motsvara 1 enhet.
Antag nu följande nollhypotes: ”19 eller fler fall med Diff ≥ 0,25 kan erhållas genom att slumpmässigt dela upp varje population i två undergrupper”. Observera att när histogrammet i figur 3 normaliseras till att ha en enhetlig yta kan det tolkas som en sannolikhetsfördelning som visar sannolikheten för att n termer med hög Diff förekommer. Om nollhypotesen är korrekt skulle ”svansen” i det normaliserade histogrammet, som är markerad i orange, ha en yta som är större än eller lika med 0,05 (om man använder en gräns på 95 %). Detta är dock inte fallet – den observerade ytan är ungefär 0,0191, vilket innebär att en stor skillnad i namngivningsbeteende, om man antar att undergrupper bildas genom slumpmässig uppdelning av den allmänna populationen, förekommer med en mycket liten sannolikhet. Vi kan därför dra slutsatsen att de skillnader som observerats genom att studera män och kvinnor är statistiskt signifikanta.
En analys av de 19 termer som uppfyller Diff (w) > 0,25 avslöjar att tre termer kommer från karajaspråket (L53 i WCS arkiven): ikura, iura och idy. Det noteras i Kay et al. (2009) att insamlingen av uppgifter om färgnamn var oregelbunden för detta språk – uppgifterna samlades in i grupper snarare än från individer, vilket gör att kartorna över termer för individer, subpopulationer och hela populationen uppvisar ovanliga fördelningar. Vi utelämnar därför detta språk från studien; observera att utelämnande av L53 från alla simuleringskörningar fortfarande ger ett histogram med en svansstorlek som är mindre än 0,05, vilket innebär att utelämnande av L53 inte ändrar slutsatserna från analysen av statistisk signifikans.
Om vi hade valt att observera termer med Diff (w) > 0,2 skulle vi ha funnit 79 termer i WCS-datamängden. Detta är för många termer för att studeras från fall till fall i detta dokument, även om vi lyfter fram några speciella exempel från denna uppsättning i diskussionen. Genom att utföra ytterligare signifikansanalys finner vi att mindre än 1 % av i 10 000 ger 79 eller fler termer med Diff (w) > 0,2, så vi kan dra slutsatsen att studiet av denna uppsättning termer också är relevant.
Fallstudier: stora skillnader mellan kvinnliga och manliga termkartor
Efter att ha tagit bort L53 från studien återstår 16 ord på 13 språk; detaljerad information för dessa språk finns i tabell 1. Nedan undersöker vi dessa 16 termer av intresse. Med tanke på färgkartorna för de språk som förekommer på denna lista kan vi identifiera följande nyckelgrupper som bestäms av stora skillnader mellan män och kvinnor:
-
Ett kön lexikaliserar en kategori eller en kategoriuppdelning, och det andra könet gör det inte (språk 75, 81, 30, 94, 103, 67). Detta kan bero på att det ena könet lär sig/erövrar en kategori före det andra könet, och i våra fall med hög differens sker detta i ”grön/blå/grue”-regionen i färgrymden. Konventionellt hänvisar ”grue” till den samling färger som på engelska kan beskrivas med antingen blått eller grönt.
-
Genrenen lexikaliserar liknande kategorier, men kan ha olika föredragna namn för kategorin. Detta kan orsakas av synonymer till inhemska färgord (språk 103) eller lånade färgord som konkurrerar med befintliga inhemska färgord (språk 67, 45, 17). I våra fall med hög skillnad ser vi att detta inträffar i området ”lila” och (ett exempel) i området ”grönt/blått/grue” i färgrymden.
-
Andra (språk 6, 21, 34, 46, 49).
Nedan betraktar vi mer detaljerat de fall som indikerar uppkomsten av en kategori i endast ett köns färgkategoriseringsschema. Specifikt lyfter vi fram det färgnamnsbeteende som uppvisas av språken murle, patep, colorado, tboli, walpiri, mazahua, huastec och cakchiquel. De återstående fallen med stor Diff (benämnda ”övriga” ovan) uppvisar inget ovanligt eller intressant beteende så vi tar upp dem i kompletterande avsnitt 2.
Fall 1: Murle (L75)
Murle-språket har en term, nyapus (w11), som har ett högt Diff-värde, se den andra raden i fig. 4. Vi kan se att enligt den kvinnliga subpopulationen betecknar w11 ibland den ”ljusblå” regionen av färger, medan den manliga subpopulationen inte använder w11 alls. Manliga talare använder endast w1 för att beteckna gruefärger. Även om kvinnorna också använder w1 för att beteckna grue-färger (grue-kategorin), tycks termerna i kartorna visa att den kvinnliga subpopulationen använde en svag extra kategori som täcker de ”ljusblå” färgerna, vilket den manliga subpopulationen inte använder. Vi noterar också att grue-kategorin för kvinnor är polariserad mot de gröna nyanserna, medan den manliga ”grue” är relativt balanserad.
Fall 2: Patep (L81)
Patep-språket har en term, bilu (w8), som har ett högt Diff-värde, se den tredje raden i fig. 5. Vi kan se att w8 bäst betecknar den ”blå” regionen av färger. Vi kan dock också se genom gråskalafärgningen av den manliga w8-kategorin att manliga talare inte använder w8 tillräckligt ofta eller konsekvent för att kvalificera w8 som CSM-basis. Manliga talare använde faktiskt w2 för att beteckna ”blå” och ”gröna” färger, och använder också ibland w1 för att beteckna de ”gröna” färgerna. Kvinnliga talare separerar de ”gröna” och ”blå” färgkategorierna tydligt med w2 respektive w8.
Fall 3: Colorado (L30)
Coradospråket har en term, losimban (w4), som har ett högt Diff-värde, se den första raden i fig. 6. Kvinnor använder w6 för att beteckna ”blått” och w4 för att beteckna ”grönt”. Däremot använder män sällan w4 för att beteckna både ”gröna” och ”blå” färger. w6 används ganska sällan av den manliga befolkningen och verkar användas för att beteckna färger som inte faller in i en känd kategori.
Fall 4: Tboli (L94)
Tboli-språket har en term, gingung (w7), som har ett högt Diff-värde (se fig. 7). Kvinnor använder w7 för att beteckna ”mörkblå-lila” medan män sällan använder w7; ”mörkblå-lila” färger finns inte representerade i någon annan manlig kategori.
I nästa fallstudier observerar vi samexistensen av konkurrerande namn för samma färgkategori.
Fall 5: Walpiri (L103)
Språket Walpiri har en term, wajirrkikajirrki (w12), som har ett högt Diff-värde, se den andra raden i fig. 8. Kvinnor har två konkurrerande ord som betecknar ”gröna” färger: w12 och w14. De ”svarta” och ”blå” färgerna täcks av w7. Å andra sidan använder hanar sällan w12 för att beteckna ”grönt”, men använder w14 (och mycket sällan w7) för att beteckna ”grönt”. Förutom en svag närvaro i kategorin w7 förekommer ”blå” färger i den icke-grundläggande kategorin w10 för både män och kvinnor (med en högre styrka för kvinnor). Walpiri behandlades ganska ingående i Lindsey och Brown (2009) som identifierade förekomsten av fem färgbenämningsmotiv i detta språk; det verkar som om könsskillnader i färgbenämningen bidrar till denna mångfald.
Fall 6: Mahahua (L67)
Mazahua-språket har två termer som har höga Diff-värden: morado och verde. Vi hänvisar till orden som w28 respektive w47, baserat på WCS-uppräkningen. Manliga och kvinnliga termkartor för w47 visas i den sjätte raden i figur 9. Vi kan se att manliga talare nästan aldrig använder w47 för att beteckna någon färg, medan kvinnliga talare använder w47 med hög frekvens och konsekvens när de beskriver färger som närmar sig den engelska kategorin ”green”. Detta är särskilt intressant när vi betraktar termkartorna för w4, som visas i den andra raden i fig. 9. Kvinnor använder w4 för att beteckna engelska ”blå” färger, medan män använder w4 för att beteckna kombinationen av ”blå” och ”gröna” färger (”grue”). Detta är därför ett exempel där ett kön lexikaliserar en stor kategori (”grue”), medan det andra könet delar upp den i två mindre kategorier (”blue” och ”green”). Manliga och kvinnliga termkartor för w28 visas i den femte raden i figur 9. w28 används av både män och kvinnor för att beteckna det ”lila” området av färger. Kvinnliga talare använder dock endast w28 för att beteckna ”lila” medan manliga talare även använder w7 för att beteckna samma uppsättning färger.
Fall 7: Huastec (L45)
Huastec-språket har två termer, morado och muyaky (w5 och w6), som har höga Diff-värden (se fig. 10). Kvinnor och män använder båda termerna för att beteckna den ”lila” regionen av färger. Kvinnliga talare föredrar dock w6 medan manliga talare föredrar w5. Det är intressant att i detta språk använder männen termen morado, lånad från spanskan, medan kvinnorna använder (traditionell) muyaku. Detta visar ett mönster som liknar det som Samarina (2007) fann i språk i Kaukasus, vilket förklaras av könsskillnader i livsstilen. Kvinnor som vanligtvis är involverade i praktiker som kräver uppmärksamhet på livsmedel, färgämnen och växter, tenderar att använda inhemska, beskrivande färgtermer. Män däremot blir involverade i handel och andra aktiviteter utanför den inhemska miljön, vilket leder till att de använder mer abstrakta, antagna färgtermer.
Fall 8: Cakchiquel (L17)
Cakchiquelspråket har en term, lila (w16), som har ett högt Diff-värde, se den femte raden i figur 11. Kvinnor använder w16 för att beteckna ”ljuslila”; män använder w16 med mindre frekvens och konsistens när de beskriver samma uppsättning färger. Vi kan dock se att medan honorna använder w10 för att beteckna ”mörklila” färger, använder männen w10 för att beteckna alla färger i området ”lila”, inklusive de ljusa och mörka varianterna.
Manliga och kvinnliga kategoriexemplar
I Fider m.fl. (2017) beskriver vi metoder för att identifiera och analysera kategoriexemplar i enlighet med data från en uppgift för färgnamn. Genom att tillämpa dessa metoder på kvinnliga och manliga subpopulationer fann vi att även om manliga och kvinnliga exemplar skiljde sig åt i vissa språk var detta resultat inte statistiskt signifikant, i den bemärkelsen att liknande mönster observerades i simuleringar med slumpmässigt utvalda pseudomale och pseudofemale populationer. Det bör noteras att den algoritm som lokaliserar exemplaret för en kategori är beroende av att hitta den tredimensionella centroiden för en samling färger och projicera den tillbaka på WCS-färguppsättningen. Den ursprungliga samlingen av färger kommer från WCS-färguppsättningen, som i första hand väljs från ”ytan” av en tredimensionell färgstomme; att beräkna massans centrum och projicera tillbaka till WCS-nätet innebär en risk för fel, och de till synes slumpmässiga resultaten för exemplar av manlig/kvinnlig typ kan helt enkelt vara en följd av detta problem. Detaljer om våra exemplarbaserade metoder och resultat finns i tilläggsavsnitt 4.
.