- Kategorioiden voimakkuus ja termikartat
- Tapaustutkimukset: Suuria eroja nais- ja miespuolisten termikarttojen välillä
- Tapaus 1: Murle (L75)
- Tapaus 2: Patep (L81)
- Tapaus 3: Coloradon kieli (L30)
- Tapaus 4: Tboli (L94)
- Tapaus 5: Walpiri (L103)
- Tapausta 6: Mahahua (L67)
- Tapaus 7: Huastec (L45)
- Tapaus 8: Cakchiquel (L17)
- Mies- ja naispuoliset kategoriaesimerkit
Kategorioiden voimakkuus ja termikartat
Menetelmällämme tunnistimme BCT:t erikseen mies- ja naispopulaatioille. Termikarttojen piirrokset on esitetty lisäosassa 7, kuviot S7-S97, kaikkien niiden WCS:n kielten osalta, joissa oli vähintään kahdeksan mies- ja kahdeksan naispuolista vastaajaa. Kun otetaan huomioon kaikki värisanat kaikissa WCS-kielissä, mies- ja naispuolisten alaryhmien sanankäyttö näyttää monissa tapauksissa olevan samanlaista. Olemme kuitenkin kiinnostuneita tutkimaan tapauksia, joissa miesten ja naisten nimeämiskäyttäytyminen näyttää olevan hyvin erilaista. Havainnollistamme joitakin mahdollisia yhtäläisyyksiä ja eroja urosten ja naaraiden välisessä kategorisoinnissa, aloitamme kahdella esimerkillä. Kuvassa 1 on esitetty naisten ja miesten kategoriavahvuusarvot, CSF ja CSM, vierekkäin kahdelle WCS-kielelle.
Vasemmanpuoleisessa paneelissa on esitetty kategorioiden vahvuudet Bauzin kielen (L12 WCS:n arkistossa) mies- ja naispuolisten osapopulaatioiden kohdalla. Kukin punainen (sininen) piste edustaa värisanaa, ja se on piirretty korkeudelle, joka vastaa sen naispuolisen (miespuolisen) kategorian vahvuutta, CSF (CSM) -arvoa. Samaa sanaa vastaavat pisteet on yhdistetty mustilla viivoilla. Kieli 12:n puhujien käyttämistä seitsemästä värisanasta viisi luokitellaan aina perustaviksi väritermeiksi (kahdella ei koskaan perustavalla väritermeillä on kategorian vahvuus 0), ja vaikka ne erotetaan mies- ja naispuolisiin alaryhmiin, nämä viisi sanaa ovat aina perustavia molempien alaryhmien osalta; termien kategorian vahvuuden järjestys on hyvin samanlainen miehillä ja naisilla. Mies- ja naispuolisten alaryhmien populaatiotermikartat, joita nimitämme TMw,F:ksi ja TMw,M:ksi kunkin sanaa w vastaavan kategorian osalta, esitetään lämpökarttoina kuvassa 2. Termikarttojen jokainen suorakulmainen pikseli edustaa WCS:ssä käytettyä värisirua siten, että termikarttojen pikselit ja WCS:n ruudukkosirut ovat samansuuntaisia; WCS:n koko sirusarja on viitteellisesti esitetty lisäosassa 1 olevassa kuvassa S1. Tummempi varjostus termikartoissa osoittaa, että vastaavat värit on nimetty sanalla wi suuremmalla osalla osapopulaatiosta. Valkoinen väritys termikartoissa osoittaa, että vastaavia värejä ei ole koskaan nimetty sanalla wi. Näemme, että nais- ja miespuhujien nimeämiskäyttäytyminen vastaa läheisesti kaikkia viittä relevanttia väritermiä.
Mies- ja naispuolisten alipopulaatioiden käyttäytyminen on erilaista cakchiquel-kielessä (L17 WCS:n arkistossa). Kuvan 1 oikeanpuoleisessa paneelissa näkyy, että termien järjestykset sukupuoleen perustuvien kategorioiden vahvuuksien mukaan ovat hyvin erilaiset. Palaamme tähän kieleen luvussa, jossa tarkastelemme konkreettisia eroja miesten ja naisten värien nimeämiskäyttäytymisessä.
Saadaksemme kokonaisvaltaisemman kuvan siitä, kuinka yleisesti ottaen samankaltaista tai erilaista miesten ja naisten nimeämiskäyttäytyminen voi olla, kvantifioimme TMw,F:n ja TMw,M:n väliset erot käyttämällä funktiota Diff (TMw,F, TMw,M) kaikissa kielissä ja kaikkien sellaisten värisanojen kohdalla, jotka ovat perussanoja ainakin yhden sukupuolen suhteen. Kuvassa 3 esitetään histogrammi kaikista näistä tiedoista. Näemme, että vaikka useimmat värisanat osoittavat samanlaista miesten ja naisten nimeämiskäyttäytymistä, on termejä, joissa ero on suhteellisen suuri; on 19 värisanaa, jotka kattavat 14 kieltä ja joiden Diff (TMw,F, TMw,M) -arvot ovat suuremmat kuin 0,25.
Tärkeä kysymys on, ovatko tässä saadut suuret erot väriluokittelussa todella merkki naaraiden ja urosten käyttäytymisen eroista. Voi olla mahdollista, että mikä tahansa populaation satunnainen jakaminen kahteen ryhmään antaa todennäköisesti joitain eroja kategorisoinnissa (tai termikartan ulkonäössä) vain sattumalta. Tutkiaksemme kuvion 3 tulosten tilastollista merkitystä jaoimme jokaisen populaation satunnaisesti kahteen alaryhmään (pseudomale-ryhmä ja pseudofemale-ryhmä) ja sovelsimme samaa menetelmää löytääksemme kunkin kielen pseudomale- ja pseudofemale-nimikäyttäytymisen erojen globaalin jakauman. Sitten laskimme ja kirjasimme niiden termien määrän, joiden Diff-arvo oli yli 0,25. Teimme tämän 10 000 kertaa; kuvassa 3 näkyy saatu laskentajakauma, jonka pinta-ala on normalisoitu yhtä suureksi kuin 1 yksikkö.
Asettakaamme nyt seuraava nollahypoteesi: ”Kunkin populaation satunnaisella jakamisella kahteen alaryhmään voidaan saada 19 tai useampia tapauksia, joiden Diff ≥ 0,25”. Huomaa, että kun se normalisoidaan niin, että sen pinta-ala on yksikkö, kuvassa 3 oleva histogrammi voidaan tulkita todennäköisyysjakaumaksi, joka osoittaa n korkean Diff-arvon termien esiintymisen todennäköisyyden. Jos nollahypoteesi on oikea, normalisoidun histogrammin oranssilla korostetun ”hännän” pinta-ala on vähintään 0,05 (95 prosentin raja-arvoa käyttäen). Näin ei kuitenkaan ole – havaittu pinta-ala on noin 0,0191, mikä tarkoittaa, että suuri ero nimeämiskäyttäytymisessä esiintyy hyvin pienellä todennäköisyydellä, jos oletetaan, että alaryhmät muodostetaan satunnaisella jakamisella yleisestä väestöstä. Voimme siis päätellä, että miehiä ja naisia tutkimalla havaitut erot ovat tilastollisesti merkitseviä.
Analyysi 19 termistä, jotka täyttävät Diff (w) > 0,25, paljastaa, että kolme termiä on karaja-kielestä (L53 WCS:n arkistossa): ikura, iura ja idy. Kay et al. (2009) toteavat, että värinimitystietojen kerääminen oli epäsäännöllistä tämän kielen osalta – tiedot kerättiin ryhmissä eikä yksilöiltä, mikä aiheuttaa sen, että yksilö-, osapopulaatio- ja koko populaation termikartoissa on epätavallisia jakaumia. Siksi jätämme tämän kielen pois tutkimuksesta; huomaa, että jättämällä L53 pois kaikista simulaatioajoista saadaan edelleen histogrammi, jonka häntäkoko on alle 0,05, mikä tarkoittaa, että L53:n poisjättäminen ei muuta tilastollisen merkitsevyysanalyysin johtopäätöksiä.
Jos olisimme valinneet havainnoida termejä, joiden Diff (w) > 0,2, olisimme löytäneet 79 termiä WCS:n aineistosta. Tämä on liian suuri määrä termejä, jotta niitä voitaisiin tutkia tapauskohtaisesti tässä työssä, vaikka nostammekin keskusteluissa esiin joitakin erityisiä esimerkkejä tästä joukosta. Suorittamalla ylimääräisen merkitsevyysanalyysin havaitsemme, että alle 1 %:lla 10 000:sta saadaan 79 tai useampia termejä, joiden Diff (w) > 0.2, joten voimme päätellä, että myös tämän termijoukon tutkiminen on relevanttia.
Tapaustutkimukset: Suuria eroja nais- ja miespuolisten termikarttojen välillä
Kun poistamme L53:n tutkimuksesta, jäljelle jää 16 sanaa 13:sta eri kielestä; yksityiskohtaiset tiedot näistä kielistä on esitetty taulukossa 1. Seuraavassa tarkastelemme näitä 16 kiinnostavaa termiä. Kun tarkastelemme tässä luettelossa esiintyvien kielten värikarttoja, voimme tunnistaa seuraavat keskeiset ryhmät, jotka määräytyvät suurten mies- ja naissukupuolten välisten erojen mukaan:
-
Yksi sukupuoli leksikalisoi kategorian tai kategoriajakauman, ja toinen sukupuoli ei (kielet 75, 81, 30, 94, 103, 67). Tämä voi johtua siitä, että toinen sukupuoli oppii/hankkii kategorian ennen toista sukupuolta, ja suurten eroavaisuuksien tapauksissamme tämä tapahtuu väriavaruuden ”vihreä/sininen/harmaa”-alueella. Konventionaalisesti ”grue” viittaa kokoelmaan värejä, jotka voidaan kuvata englanniksi joko sinisellä tai vihreällä.
-
Sukupuolet leksikalisoivat samankaltaisia kategorioita, mutta niillä voi olla eri mieluisat nimet kategorialle. Tämä voi johtua natiivien värisanojen synonyymeistä (kieli 103) tai lainatuista värisanoista, jotka kilpailevat olemassa olevien natiivien värisanojen kanssa (kielet 67, 45, 17). Tapauksissa, joissa ero on suuri, tätä esiintyy väriavaruuden ”violetin” alueella ja (yksi esimerkki) ”vihreän/sinisen/harmaan” alueella.
-
Muut (kielet 6, 21, 34, 46, 49).
Alhaalla tarkastelemme yksityiskohtaisemmin tapauksia, jotka viittaavat kategorian ilmaantumiseen vain yhden sukupuolen värien luokittelujärjestelmässä. Erityisesti nostamme esiin Murlen, Patepin, Coloradon, Tbolin, Walpirin, Mazahuan, Huastecin ja Cakchiquelin kielten osoittaman värien nimeämiskäyttäytymisen. Loput suuret diff-tapaukset (joita edellä kutsuttiin ”muiksi”) eivät osoita epätavallista tai mielenkiintoista käyttäytymistä, joten käsittelemme niitä täydentävässä jaksossa 2.
Tapaus 1: Murle (L75)
Murle-kielessä on yksi termi, nyapus (w11), jolla on korkea diff-arvo, ks. kuvion 4 toinen rivi. Näemme, että naispuolisen osapopulaation mukaan w11 tarkoittaa toisinaan värien ”vaaleansinistä” aluetta, kun taas miespuolinen osapopulaatio ei käytä w11:tä lainkaan. Miespuoliset puhujat käyttävät vain w1:tä harmaasävyjen nimeämiseen. Vaikka naaraat käyttävät myös w1:tä grue-värien nimeämiseen (grue-kategoria), termikartat näyttävät osoittavan, että naarasväestö käytti heikkoa ylimääräistä kategoriaa, joka kattaa ”vaaleansiniset” värit, joita miesväestö ei käytä. Huomaamme myös, että naaraiden grue-kategoria on polarisoitunut kohti vihreitä sävyjä, kun taas miesten ”grue” on suhteellisen tasapainoinen.
Tapaus 2: Patep (L81)
Patepin kielessä on yksi termi, bilu (w8), jolla on korkea Diff-arvo, ks. kuvion 5 kolmas rivi. Näemme, että w8 kuvaa parhaiten värien ”sinistä” aluetta. Voimme kuitenkin myös nähdä miespuolisten w8-kategorian harmaasävyjen perusteella, että miespuoliset puhujat eivät käytä w8:aa riittävän usein tai johdonmukaisesti, jotta w8:aa voitaisiin pitää CSM-perusvärinä. Miespuhujat nimittäin käyttivät w2:ta ”sinisten” ja ”vihreiden” värien nimeämiseen ja satunnaisesti myös w1:tä ”vihreiden” värien nimeämiseen. Naiset erottelevat ”vihreän” ja ”sinisen” värikategoriat selvästi w2:lla ja w8:lla.
Tapaus 3: Coloradon kieli (L30)
Coloradon kielessä on yksi termi, losimban (w4), jolla on korkea Diff-arvo, ks. kuvion 6 ensimmäistä riviä. Naaraat käyttävät w6:ta merkitsemään ”sinistä” ja w4:ää merkitsemään ”vihreää”. Sitä vastoin miehet käyttävät harvoin w4:ää sekä ”vihreän” että ”sinisen” värien nimeämiseen. w6:aa käytetään miesväestössä melko harvoin, ja sitä näyttää käytettävän sellaisten värien nimeämiseen, jotka eivät kuulu mihinkään tunnettuun kategoriaan.
Tapaus 4: Tboli (L94)
Tbolin kielessä on yksi termi, gingung (w7), jolla on korkea Diff-arvo (ks. kuva 7). Naiset käyttävät w7:ää merkitsemään ”tummansinistä-violettia”, kun taas miehet käyttävät w7:ää harvoin; ”tummansinistä-violettia” väriä ei ole edustettuna missään muussa mieskategoriassa.