- Category strength and term maps
- Casestudies: grote verschillen tussen vrouwelijke en mannelijke term maps
- Voorbeeld 1: Murle (L75)
- Geval 2: Patep (L81)
- Geval 3: Colorado (L30)
- Geval 4: Tboli (L94)
- Geval 5: Walpiri (L103)
- Geval 6: Mahahua (L67)
- Geval 7: Huastec (L45)
- Voorbeeld 8: Cakchiquel (L17)
- Mannelijke en vrouwelijke categorie-voorbeelden
Category strength and term maps
We gebruikten onze methodologie om BCTs voor mannelijke en vrouwelijke populaties afzonderlijk te identificeren. Plots van term maps worden gepresenteerd in Supplementary Section 7, Figs S7-S97, voor alle talen in WCS met ten minste acht mannelijke en acht vrouwelijke respondenten. Als we alle kleurwoorden in alle WCS talen bekijken, lijken de mannelijke en vrouwelijke subpopulaties in veel gevallen een vergelijkbaar woordgebruik te gebruiken. We zijn echter geïnteresseerd in gevallen waarin het benoemingsgedrag van mannen en vrouwen erg verschillend lijkt te zijn. Om enkele mogelijke overeenkomsten en verschillen in categorie-sterkte tussen mannetjes en vrouwtjes te illustreren, beginnen we met twee voorbeelden. Figuur 1 toont de vrouwelijke en mannelijke categoriesterktewaarden, CSF en CSM, naast elkaar voor twee WCS-talen.
Het linkerpaneel toont de sterktes van de categorieën ten opzichte van de mannelijke en vrouwelijke subpopulaties van de Bauzi-taal (L12 in de WCS-archieven). Elk rood (blauw) punt vertegenwoordigt een kleurwoord en is uitgezet op een hoogte die overeenkomt met zijn vrouwelijke (mannelijke) categoriesterkte, CSF (CSM) waarde. Punten die overeenkomen met hetzelfde woord zijn verbonden door zwarte lijnen. Van de zeven kleurwoorden die gebruikt worden door Taal 12 sprekers, zijn er vijf geclassificeerd als altijd-basieke kleurentermen (de twee nooit-basieke kleurentermen hebben categoriesterkte 0), en zelfs wanneer ze gescheiden worden in mannelijke en vrouwelijke subgroepen zijn de vijf woorden altijd-basisch met betrekking tot beide subpopulaties; de volgorde van de categoriesterkte van de termen is zeer vergelijkbaar bij mannen en vrouwen. De termkaarten voor de mannelijke en vrouwelijke subpopulaties, die we aanduiden met TMw,F en TMw,M voor elke categorie die overeenkomt met een woord w, worden weergegeven als heatmaps in Fig. 2. Elke rechthoekige pixel in de term maps vertegenwoordigt een kleur chip gebruikt in de WCS, zodat de pixels in de term maps en de WCS raster chips zijn georiënteerd op dezelfde manier; de volledige WCS chipset wordt getoond in Fig. S1 in Supplementary Section 1 voor referentie. Donkerder arcering in de term kaarten geeft aan dat de overeenkomstige kleuren worden genoemd met het woord wi door een grotere fractie van de subpopulatie. Witte kleuring in de term maps geeft aan dat de corresponderende kleuren nooit met het woord wi worden benoemd. We zien dat het benoemingsgedrag van vrouwelijke en mannelijke sprekers nauw overeenkomt voor alle vijf relevante kleurentermen.
De mannelijke en vrouwelijke subpopulaties vertonen verschillende gedragingen in de Cakchiquel taal (L17 in de WCS archieven). In Fig. 1, rechter paneel, kunnen we zien dat de volgorde van termen volgens de van geslacht afgeleide categoriesterktes zeer verschillend is. We komen op deze taal terug in het deel waarin we concrete verschillen in mannelijk en vrouwelijk kleur-naamgedrag onderzoeken.
Om een meer globaal beeld te krijgen van hoe algemeen gelijk of verschillend mannelijk en vrouwelijk naamgedrag kan zijn, kwantificeren we de verschillen tussen TMw,F en TMw,M met behulp van de functie Diff (TMw,F, TMw,M) over alle talen, en over alle kleurwoorden die basaal zijn met betrekking tot minstens een van de geslachten. Figuur 3 toont een histogram van al deze gegevens. We zien dat hoewel de meeste kleurentermen een vergelijkbaar mannelijk/vrouwelijk naamgevingsgedrag vertonen, er termen zijn waarbij het verschil relatief groot is; er zijn 19 kleurentermen, verspreid over 14 talen, met een Diff (TMw,F, TMw,M)-waarde groter dan 0,25.
Een belangrijke vraag is of de grote verschillen in kleur categorisatie hier verkregen zijn echt een handtekening van verschillen in vrouwelijke en mannelijke gedrag. Het is mogelijk dat elke willekeurige splitsing van een populatie in twee groepen waarschijnlijk enkele verschillen in categorisatie (of, term-map verschijning) gewoon door toeval geeft. Om de statistische significantie van de resultaten van Fig. 3 te bestuderen, verdeelden we elke populatie willekeurig in twee subgroepen (de pseudomannetjesgroep en de pseudovrouwtjesgroep) en pasten we dezelfde methodologie toe om de globale verdeling van verschillen tussen het pseudomannelijk en pseudovrouwelijk naamgevingsgedrag van elke taal te vinden. Vervolgens hebben we het aantal termen geteld en genoteerd die een Diff-waarde van meer dan 0.25 hebben. Wij deden dit 10.000 maal; Fig. 3 toont de verkregen verdeling van de tellingen, met de oppervlakte genormaliseerd om gelijk te zijn aan 1 eenheid.
Nu veronderstellen wij de volgende nulhypothese: “19 of meer gevallen met Diff ≥ 0.25 kunnen worden verkregen door elke populatie willekeurig te verdelen in twee subgroepen”. Merk op dat wanneer het histogram in Fig. 3 genormaliseerd is tot een oppervlakte-eenheid, het kan worden geïnterpreteerd als een waarschijnlijkheidsverdeling die de waarschijnlijkheid van het voorkomen van n hoog Diff-termen weergeeft. Als de nulhypothese correct is, zou de oranje gekleurde “staart” van het genormaliseerde histogram een gebied groter dan of gelijk aan 0,05 moeten hebben (bij gebruik van de 95%-afkapwaarde). Dit is echter niet het geval – het waargenomen gebied is ongeveer 0,0191, hetgeen impliceert dat een grote mate van verschil in naamgevingsgedrag, in de veronderstelling dat subgroepen worden gevormd door willekeurige splitsing van de algemene bevolking, met een zeer kleine waarschijnlijkheid voorkomt. We kunnen daarom concluderen dat de verschillen die zijn waargenomen door het bestuderen van mannen en vrouwen statistisch significant zijn.
Analyse van de 19 termen die voldoen aan Diff (w) > 0.25 onthult dat drie termen afkomstig zijn uit de Karaja-taal (L53 in de WCS-archieven): ikura, iura, en idy. In Kay et al. (2009) wordt opgemerkt dat het verzamelen van kleur-naam gegevens onregelmatig was voor deze taal – gegevens werden verzameld in groepen in plaats van van individuen, waardoor de individuele, subpopulatie, en volledige-populatie term kaarten ongebruikelijke distributies vertonen. Daarom laten we deze taal buiten beschouwing; merk op dat het weglaten van L53 uit alle simulatieruns nog steeds een histogram oplevert met een staartgrootte kleiner dan 0.05, wat betekent dat het weglaten van L53 de conclusies van de statistische significantie-analyse niet verandert.
Als we ervoor hadden gekozen om termen met Diff (w) > 0.2 te observeren, dan zouden we 79 termen hebben gevonden in de WCS-dataset. Dit zijn te veel termen om in dit artikel van geval tot geval te bestuderen, hoewel we in de Discussie enkele bijzondere voorbeelden uit deze reeks belichten. Door het uitvoeren van extra significantie-analyse, vinden we dat minder dan 1% van de 10.000 termen 79 of meer termen oplevert met Diff (w) > 0.2, zodat we kunnen concluderen dat de studie van deze set van termen ook relevant is.
Casestudies: grote verschillen tussen vrouwelijke en mannelijke term maps
Na het verwijderen van L53 uit de studie, blijven we over met 16 woorden in 13 talen; gedetailleerde informatie voor deze talen wordt gegeven in Tabel 1. Hieronder verkennen we deze 16 termen van belang. Als we de kleurenkaarten bekijken van de talen die op deze lijst voorkomen, kunnen we de volgende hoofdgroepen identificeren die worden bepaald door grote man-vrouw-verschillen:
-
Een geslacht lexicaliseert een categorie of een categoriesplitsing, en het andere geslacht doet dat niet (talen 75, 81, 30, 94, 103, 67). Dit kan worden veroorzaakt doordat het ene geslacht een categorie eerder leert/verkrijgt dan het andere geslacht, en in onze gevallen met een hoog verschil gebeurt dit in het “groen/blauw/grue”-gebied van de kleurenruimte. In het Engels verwijst “grue” naar de verzameling kleuren die in het Engels kunnen worden beschreven met blauw of groen.
-
De geslachten lexicaliseren vergelijkbare categorieën, maar kunnen verschillende voorkeursnamen hebben voor de categorie. Dit kan worden veroorzaakt door inheemse synoniemen voor kleurwoorden (taal 103), of door geleende kleurwoorden die concurreren met bestaande inheemse kleurwoorden (talen 67, 45, 17). In onze gevallen met een hoog verschil zien we dit voorkomen in de regio “paars” en (één voorbeeld) in de regio “groen/blauw/grue” van de kleurruimte.
-
Anders (talen 6, 21, 34, 46, 49).
Hieronder gaan we nader in op de gevallen die duiden op het ontstaan van een categorie in het kleurencategoriseringsschema van slechts één sekse. We belichten met name het kleurbenoemingsgedrag van de Murle-, Patep-, Colorado-, Tboli-, Walpiri-, Mazahua-, Huastec- en Cakchiqueltalen. De overige gevallen met een groot verschil (hierboven “andere” genoemd) vertonen geen ongewoon of interessant gedrag, zodat we ze behandelen in Aanvullend Deel 2.
Voorbeeld 1: Murle (L75)
De Murle taal heeft één term, nyapus (w11), die een hoge Diff waarde heeft, zie de tweede rij van Fig. 4. We kunnen zien dat volgens de vrouwelijke subpopulatie, w11 af en toe het “lichtblauwe” gebied van kleuren aanduidt, terwijl de mannelijke subpopulatie w11 helemaal niet gebruikt. Mannelijke sprekers gebruiken alleen w1 om grue kleuren aan te duiden. Terwijl vrouwtjes ook w1 gebruiken om grue kleuren aan te duiden (de grue categorie), lijken de termen erop te wijzen dat de vrouwelijke subpopulatie een zwakke extra categorie gebruikt die de “lichtblauwe” kleuren dekt, die de mannelijke subpopulatie niet gebruikt. We zien ook dat de “grue”-categorie voor vrouwen gepolariseerd is in de richting van de groene tinten, terwijl de “grue” voor mannen relatief evenwichtig is.
Geval 2: Patep (L81)
De Patep-taal heeft één term, bilu (w8), die een hoge Diff-waarde heeft, zie de derde rij van Fig. 5. We kunnen zien dat w8 het best het “blauwe” gebied van kleuren aanduidt. We kunnen echter ook zien aan de grijstinten van de mannelijke w8 categorie dat mannelijke sprekers w8 niet vaak genoeg of niet consistent genoeg gebruiken om w8 als CSM-basis te kwalificeren. Mannelijke sprekers gebruiken w2 om “blauwe” en “groene” kleuren aan te duiden, en gebruiken ook af en toe w1 om de “groene” kleuren aan te duiden. Vrouwelijke sprekers onderscheiden de “groene” en “blauwe” kleurcategorieën duidelijk met respectievelijk w2 en w8.
Geval 3: Colorado (L30)
De taal van Colorado heeft één term, losimban (w4), die een hoge Diff-waarde heeft, zie de eerste rij van Fig. 6. Vrouwtjes gebruiken w6 om “blauw” aan te duiden en w4 om “groen” aan te duiden. Mannetjes daarentegen gebruiken w4 zelden om zowel “groene” als “blauwe” kleuren aan te duiden; w6 wordt vrij zelden gebruikt door de mannelijke populatie en lijkt te worden gebruikt om kleuren aan te duiden die niet in een bekende categorie vallen.
Geval 4: Tboli (L94)
De Tboli taal heeft één term, gingung (w7), die een hoge Diff waarde heeft (zie Fig. 7). Vrouwtjes gebruiken w7 om “donkerblauw-paars” aan te duiden, terwijl mannetjes w7 zelden gebruiken; “donkerblauw-paars”-kleuren komen in geen enkele andere mannelijke categorie voor.
In de volgende casestudies observeren we het naast elkaar bestaan van concurrerende namen voor dezelfde kleurcategorie.
Geval 5: Walpiri (L103)
De Walpiri taal heeft één term, wajirrkikajirrki (w12), die een hoge Diff-waarde heeft, zie de tweede rij van Fig. 8. Vrouwtjes hebben twee concurrerende woorden die “groene” kleuren aanduiden: w12 en w14. De “zwarte” en “blauwe” kleuren worden gedekt door w7. Mannetjes daarentegen gebruiken zelden w12 om “groen” aan te duiden, maar gebruiken w14 (en heel af en toe w7) om “groen” aan te duiden. Behalve een zwakke aanwezigheid in de w7 categorie, komen “blauwe” kleuren voor in de niet-basis categorie w10 voor zowel mannen als vrouwen (met een hogere sterkte voor vrouwen). Walpiri werd in enig detail bekeken in Lindsey en Brown (2009) die het bestaan van vijf kleurbenoemingsmotieven in deze taal identificeerden; het lijkt erop dat sekseverschillen in kleurbenoeming bijdragen aan deze diversiteit.
Geval 6: Mahahua (L67)
De Mazahua-taal kent twee termen die een hoge Diff-waarde hebben: morado, en verde. We noemen de woorden respectievelijk w28 en w47, gebaseerd op de WCS opsomming. Mannelijke en vrouwelijke termkaarten voor w47 worden getoond in de zesde rij van Fig. 9. We zien dat mannelijke sprekers w47 bijna nooit gebruiken om kleuren aan te duiden, terwijl vrouwelijke sprekers w47 met een hoge frequentie en consistentie gebruiken wanneer ze kleuren beschrijven die de Engelse “green” categorie benaderen. Dit is vooral interessant als we kijken naar de term maps van w4, weergegeven in de tweede rij van Fig. 9. Vrouwen gebruiken w4 om Engelse “blauwe” kleuren aan te duiden, terwijl mannen w4 gebruiken om de combinatie van “blauwe” en “groene” kleuren aan te duiden (“grue”). Dit is dus een voorbeeld waar het ene geslacht een grote categorie lexicaliseert (“grue”), terwijl het andere geslacht het opdeelt in twee kleinere categorieën (“blue” en “green”). Mannelijke en vrouwelijke termkaarten voor w28 worden getoond in de vijfde rij van Fig. 9. w28 wordt door mannen en vrouwen gebruikt om de “paarse” regio van kleuren aan te duiden. Vrouwelijke sprekers gebruiken echter alleen w28 om “paars” aan te duiden, terwijl mannelijke sprekers ook w7 gebruiken om dezelfde reeks kleuren aan te duiden.
Geval 7: Huastec (L45)
De Huastec taal kent twee termen, morado en muyaky (w5 en w6), die hoge Diff waarden hebben (zie Fig. 10). Vrouwen en mannen gebruiken beide termen om het “paarse” gebied van kleuren aan te duiden. Vrouwelijke sprekers geven echter de voorkeur aan w6, terwijl mannelijke sprekers w5 prefereren. Het is interessant dat in deze taal de mannen de term morado gebruiken, ontleend aan het Spaans, terwijl de vrouwen de (traditionele) muyaku gebruiken. Dit vertoont een patroon dat vergelijkbaar is met dat wat Samarina (2007) vond in talen van de Kaukasus, en dat verklaard wordt door sekseverschillen in de levensstijl. Vrouwtjes, die typisch betrokken zijn bij praktijken die aandacht vereisen voor voedsel, kleurstoffen en planten, neigen ertoe inheemse, beschrijvende kleurentermen te gebruiken. Mannetjes daarentegen raken betrokken bij handel en andere activiteiten buiten de huiselijke omgeving, waardoor zij meer abstracte, overgenomen kleurentermen gebruiken.
Voorbeeld 8: Cakchiquel (L17)
De Cakchiquel-taal heeft één term, lila (w16), die een hoge Diff-waarde heeft, zie de vijfde rij van Fig. 11. Vrouwtjes gebruiken w16 om “lichtpaars” aan te duiden; mannetjes gebruiken w16 met minder frequentie en consistentie bij het beschrijven van dezelfde set kleuren. We zien echter dat terwijl vrouwtjes w10 gebruiken om “donkerpaarse” kleuren aan te duiden, mannetjes w10 gebruiken om alle kleuren in de “paarse” regio aan te duiden, inclusief de lichte en donkere variëteiten.
Mannelijke en vrouwelijke categorie-voorbeelden
In Fider et al. (2017) schetsen we methoden voor het identificeren en analyseren van categorie-voorbeelden aan de hand van gegevens uit een kleur-benoemingstaak. Door die methoden toe te passen op de vrouwelijke en mannelijke subpopulaties, ontdekten we dat, hoewel in sommige talen mannelijke en vrouwelijke exemplars verschilden, dit resultaat statistisch niet significant was, in de zin dat vergelijkbare patronen werden waargenomen in simulaties met willekeurig geselecteerde pseudomannelijke en pseudovrouwelijke populaties. Er zij op gewezen dat het algoritme dat het voorbeeld van een categorie lokaliseert, afhangt van het vinden van het driedimensionale zwaartepunt van een verzameling kleuren en het terugprojecteren daarvan op de WCS-kleurenverzameling. De oorspronkelijke verzameling kleuren is afkomstig van de WCS-kleurenverzameling, die hoofdzakelijk wordt gekozen uit het “oppervlak” van een driedimensionaal kleurvlak; het berekenen van het zwaartepunt en het terugprojecteren op het WCS-raster introduceert de mogelijkheid van fouten, en de schijnbaar willekeurige man/vrouw-voorbeeldresultaten zouden gewoon een gevolg van dit probleem kunnen zijn. Details met betrekking tot onze exemplar-gebaseerde methoden en resultaten zijn te vinden in Supplementary Section 4.