- Puissance des catégories et cartes des termes
- Études de cas : grandes différences entre les cartes de termes féminins et masculins
- Cas 1 : Murle (L75)
- Cas 2 : Patep (L81)
- Cas 3 : Colorado (L30)
- Cas 4 : Tboli (L94)
- Cas 5 : Walpiri (L103)
- Cas 6 : Mahahua (L67)
- Cas 7 : Huastec (L45)
- Cas 8 : Cakchiquel (L17)
- Exemplaires de catégories masculines et féminines
Puissance des catégories et cartes des termes
Nous avons utilisé notre méthodologie pour identifier les BCT pour les populations masculines et féminines séparément. Les tracés des cartes de termes sont présentés dans la section supplémentaire 7, Figs S7-S97, pour toutes les langues de WCS avec au moins huit répondants masculins et huit répondants féminins. Si l’on considère tous les mots de couleur dans toutes les langues du WCS, dans de nombreux cas, les sous-populations masculine et féminine semblent utiliser les mêmes mots. Cependant, nous sommes intéressés par l’étude des cas où les comportements de dénomination masculins et féminins semblent être très différents. Pour illustrer les similitudes et les différences possibles entre les hommes et les femmes en ce qui concerne la force des catégories, nous commençons par deux exemples. La figure 1 montre les valeurs de force de catégorie féminine et masculine, CSF et CSM, côte à côte pour deux langues WCS.
Le panneau de gauche montre les forces des catégories par rapport aux sous-populations masculines et féminines de la langue Bauzi (L12 dans les archives WCS). Chaque point rouge (bleu) représente un mot de couleur et est tracé à une hauteur correspondant à sa force de catégorie féminine (masculine), valeur CSF (CSM). Les points qui correspondent au même mot sont reliés par des lignes noires. Sur les sept mots de couleur utilisés par les locuteurs de la langue 12, cinq sont classés comme des termes de couleur toujours basiques (les deux termes de couleur jamais basiques ont une force de catégorie de 0), et même lorsqu’ils sont séparés en sous-groupes masculins et féminins, les cinq mots sont toujours basiques par rapport aux deux sous-populations ; l’ordre de la force de catégorie des termes est très similaire chez les hommes et les femmes. Les cartes de termes des sous-populations masculine et féminine, que nous désignons par TMw,F et TMw,M pour chaque catégorie correspondant à un mot w, sont présentées sous forme de cartes thermiques sur la figure 2. Chaque pixel rectangulaire dans les cartes de termes représente une puce de couleur utilisée dans le WCS, de sorte que les pixels des cartes de termes et les puces de la grille WCS sont orientés de la même manière ; le jeu complet de puces WCS est présenté dans la Fig. S1 de la section supplémentaire 1 pour référence. Un ombrage plus foncé dans les cartes de termes indique que les couleurs correspondantes sont nommées avec le mot wi par une plus grande fraction de la sous-population. Une coloration blanche dans les cartes de termes indique que les couleurs correspondantes ne sont jamais nommées avec le mot wi. Nous pouvons voir que le comportement de dénomination des locuteurs féminins et masculins correspond étroitement sur les cinq termes de couleur pertinents.
Les sous-populations masculines et féminines montrent des comportements différents dans la langue Cakchiquel (L17 dans les archives WCS). Dans la Fig. 1, panneau de droite, nous pouvons voir que les ordonnancements des termes selon les forces de catégories dérivées du genre sont très différents. Nous reviendrons à cette langue dans la section où nous explorerons les différences concrètes dans le comportement de dénomination des couleurs chez les hommes et les femmes.
Pour obtenir une vue plus globale de la similitude ou de la différence générale des comportements de dénomination chez les hommes et les femmes, nous quantifions les différences entre TMw,F et TMw,M en utilisant la fonction Diff (TMw,F, TMw,M) dans toutes les langues, et dans tous les mots de couleur qui sont basiques par rapport à au moins un des genres. La figure 3 montre un histogramme de toutes ces données. Nous pouvons voir que si la plupart des termes de couleur montrent un comportement de dénomination masculin/féminin similaire, il y a des termes où la différence est relativement importante ; il y a 19 mots de couleur, couvrant 14 langues, qui ont des valeurs Diff (TMw,F, TMw,M) supérieures à 0,25.
Une question importante est de savoir si les grandes différences dans la catégorisation des couleurs obtenues ici sont vraiment une signature des différences dans le comportement des femelles et des mâles. Il est possible que toute division aléatoire d’une population en deux groupes soit susceptible de donner quelques différences de catégorisation (ou, d’apparence de la carte des termes) juste par hasard. Pour étudier la signification statistique des résultats de la figure 3, nous avons divisé aléatoirement chaque population en deux sous-groupes (le groupe des pseudomâles et le groupe des pseudofemelles) et nous avons appliqué la même méthodologie pour trouver la distribution globale des différences entre les comportements de dénomination pseudomâles et pseudofemelles de chaque langue. Nous avons ensuite compté et enregistré le nombre de termes qui ont une valeur de Diff supérieure à 0,25. Nous avons fait cela 10 000 fois ; la figure 3 montre la distribution des comptages obtenus, avec une surface normalisée pour être égale à 1 unité.
Prenez maintenant l’hypothèse nulle suivante : « 19 cas ou plus avec Diff ≥ 0,25 peuvent être obtenus en divisant aléatoirement chaque population en deux sous-groupes ». Notez que lorsqu’il est normalisé pour avoir une surface unitaire, l’histogramme de la figure 3 peut être interprété comme une distribution de probabilité qui montre la probabilité d’apparition de n termes à fort Diff. Si l’hypothèse nulle est correcte, la « queue » de l’histogramme normalisé, surlignée en orange, aurait une aire supérieure ou égale à 0,05 (en utilisant le seuil de 95%). Ce n’est cependant pas le cas – l’aire observée est d’environ 0,0191, ce qui implique qu’une grande différence dans le comportement de dénomination, en supposant que les sous-groupes sont formés par fractionnement aléatoire de la population générale, se produit avec une très faible probabilité. Nous pouvons donc conclure que les différences observées en étudiant les hommes et les femmes sont statistiquement significatives.
L’analyse des 19 termes satisfaisant à Diff (w) > 0,25 révèle que trois termes proviennent de la langue karaja (L53 dans les archives WCS) : ikura, iura, et idy. Il est noté dans Kay et al. (2009) que la collecte de données sur les noms de couleur était irrégulière pour cette langue – les données ont été collectées dans des groupes plutôt que sur des individus, ce qui fait que les cartes de termes des individus, de la sous-population et de la population entière présentent des distributions inhabituelles. Nous omettons donc cette langue de l’étude ; notez que l’omission de L53 de toutes les simulations donne encore un histogramme avec une taille de queue inférieure à 0,05, ce qui signifie que l’exclusion de L53 ne change pas les conclusions de l’analyse de signification statistique.
Si nous avions choisi d’observer les termes avec Diff (w) > 0,2, nous aurions trouvé 79 termes dans l’ensemble de données WCS. Ce nombre de termes est trop important pour être étudié au cas par cas dans cet article, bien que nous soulignions quelques exemples particuliers de cet ensemble dans la discussion. En effectuant une analyse de signification supplémentaire, nous constatons que moins de 1% de dans 10 000 donnent 79 termes ou plus avec Diff (w) > 0,2, nous pouvons donc conclure que l’étude de cet ensemble de termes est également pertinente.
Études de cas : grandes différences entre les cartes de termes féminins et masculins
Après avoir retiré L53 de l’étude, il nous reste 16 mots à travers 13 langues ; des informations détaillées pour ces langues sont fournies dans le tableau 1. Nous explorons ci-dessous ces 16 termes d’intérêt. En considérant les cartes de couleur des langues qui apparaissent sur cette liste, nous pouvons identifier les groupes clés suivants déterminés par de grandes différences homme-femme :
-
Un genre lexicalise une catégorie ou une division de catégorie, et l’autre genre ne le fait pas (langues 75, 81, 30, 94, 103, 67). Cela pourrait être dû au fait qu’un sexe apprend/acquiert une catégorie avant l’autre sexe, et dans nos cas de différences élevées, cela se produit dans la région « vert/bleu/grue » de l’espace couleur. Conventionnellement, « grue » fait référence à la collection de couleurs qui peuvent être décrites en anglais par bleu ou vert.
-
Les genres lexicalisent des catégories similaires, mais peuvent avoir des noms préférés différents pour la catégorie. Cela pourrait être causé par des synonymes de mots de couleur natifs (langue 103), ou des mots de couleur empruntés qui entrent en concurrence avec des mots de couleur natifs existants (langues 67, 45, 17). Dans nos cas à fort différentiel, nous voyons cela se produire dans la région » violet » et (un exemple) dans la région » vert/bleu/gris » de l’espace couleur.
-
Autres (langues 6, 21, 34, 46, 49).
Ci-après, nous examinons plus en détail les cas qui indiquent l’émergence d’une catégorie dans le schéma de catégorisation des couleurs d’un seul genre. Plus précisément, nous mettons en évidence le comportement de dénomination des couleurs présenté par les langues Murle, Patep, Colorado, Tboli, Walpiri, Mazahua, Huastec et Cakchiquel. Les autres cas de grand Diff (appelés « autres » ci-dessus) ne présentent pas de comportement inhabituel ou intéressant, nous les abordons donc dans la section supplémentaire 2.
Cas 1 : Murle (L75)
La langue Murle possède un terme, nyapus (w11), qui a une valeur de Diff élevée, voir la deuxième ligne de la figure 4. Nous pouvons voir que selon la sous-population féminine, w11 désigne occasionnellement la région « bleu clair » des couleurs, alors que la sous-population masculine n’utilise pas du tout w11. Les locuteurs masculins utilisent uniquement w1 pour désigner les couleurs grues. Bien que les femmes utilisent également w1 pour désigner les couleurs grue (la catégorie grue), les cartes de termes semblent indiquer que la sous-population féminine utilise une catégorie supplémentaire faible couvrant les couleurs « bleu clair », que la sous-population masculine n’utilise pas. Nous remarquons également que la catégorie grue des femelles est polarisée vers les teintes vertes, alors que la « grue » des mâles est relativement équilibrée.
Cas 2 : Patep (L81)
La langue Patep a un terme, bilu (w8), qui a une valeur Diff élevée, voir la troisième ligne de la Fig. 5. Nous pouvons voir que w8 désigne le mieux la région « bleue » des couleurs. Cependant, nous pouvons également voir par la coloration en niveaux de gris de la catégorie w8 masculine que les locuteurs masculins n’utilisent pas w8 assez souvent ou de manière assez cohérente pour qualifier w8 comme CSM de base. En effet, les locuteurs masculins utilisent w2 pour désigner les couleurs « bleu » et « vert », et utilisent aussi occasionnellement w1 pour désigner les couleurs « vert ». Les femelles séparent distinctement les catégories de couleurs « vertes » et « bleues » avec w2 et w8, respectivement.
Cas 3 : Colorado (L30)
La langue du Colorado possède un terme, losimban (w4), qui a une valeur Diff élevée, voir la première ligne de la figure 6. Les femelles utilisent w6 pour désigner le « bleu » et w4 pour désigner le « vert ». En revanche, les mâles utilisent rarement w4 pour désigner les couleurs « vertes » et « bleues » ; w6 est utilisé assez rarement par la population masculine et semble être utilisé pour désigner les couleurs qui n’entrent pas dans une catégorie connue.
Cas 4 : Tboli (L94)
La langue Tboli possède un terme, gingung (w7), qui a une valeur Diff élevée (voir Fig. 7). Les femmes utilisent w7 pour désigner le « bleu-violet foncé » alors que les hommes utilisent rarement w7 ; les couleurs « bleu-violet foncé » ne sont représentées dans aucune autre catégorie masculine.
Dans les études de cas suivantes, nous observons la coexistence de noms concurrents pour la même catégorie de couleur.
Cas 5 : Walpiri (L103)
La langue Walpiri possède un terme, wajirrkikajirrki (w12), qui a une valeur Diff élevée, voir la deuxième ligne de la figure 8. Les femelles ont deux mots concurrents qui désignent les couleurs « vertes » : w12 et w14. Les couleurs « noir » et « bleu » sont couvertes par w7. En revanche, les mâles utilisent rarement w12 pour désigner le « vert », mais utilisent w14 (et très occasionnellement w7) pour désigner le « vert ». En dehors d’une faible présence dans la catégorie w7, les couleurs « bleues » apparaissent dans la catégorie non basique w10 pour les mâles et les femelles (avec une force plus élevée pour les femelles). Le walpiri a été considéré de manière assez détaillée dans Lindsey et Brown (2009) qui ont identifié l’existence de cinq motifs de dénomination des couleurs dans cette langue ; il semble que les différences de genre dans la dénomination des couleurs contribuent à cette diversité.
Cas 6 : Mahahua (L67)
La langue mazahua possède deux termes qui ont des valeurs Diff élevées : morado, et verde. Nous désignons ces mots, respectivement, par w28 et w47, sur la base de l’énumération WCS. Les cartes des termes masculins et féminins pour w47 sont présentées dans la sixième ligne de la Fig. 9. Nous pouvons voir que les locuteurs masculins n’utilisent presque jamais w47 pour désigner une couleur, alors que les femmes utilisent w47 avec une fréquence et une cohérence élevées lorsqu’elles décrivent des couleurs qui se rapprochent de la catégorie anglaise « green ». Ceci est particulièrement intéressant lorsque l’on considère les cartes de termes de w4, présentées dans la deuxième ligne de la Fig. 9. Les femmes utilisent w4 pour désigner les couleurs « bleues » anglaises, tandis que les hommes utilisent w4 pour désigner la combinaison de couleurs « bleues » et « vertes » (« grue »). Il s’agit donc d’un exemple où un sexe lexicalise une grande catégorie ( » grue « ), tandis que l’autre sexe la divise en deux catégories plus petites ( » bleu » et » vert « ). Les cartes de termes masculins et féminins pour w28 sont présentées dans la cinquième ligne de la Fig. 9. w28 est utilisé par les hommes et les femmes pour désigner la région « violette » des couleurs. Cependant, les locuteurs féminins utilisent uniquement w28 pour désigner le « violet » alors que les locuteurs masculins utilisent également w7 pour désigner le même ensemble de couleurs.
Cas 7 : Huastec (L45)
La langue Huastec possède deux termes, morado et muyaky (w5 et w6), qui ont des valeurs Diff élevées (voir Fig. 10). Les femelles et les mâles utilisent les deux termes pour désigner la région « violette » des couleurs. Cependant, les locuteurs féminins favorisent w6 alors que les locuteurs masculins favorisent w5. Il est intéressant de noter que dans cette langue, les mâles utilisent le terme morado, emprunté à l’espagnol, alors que les femelles utilisent le terme (traditionnel) muyaku. Cela montre un modèle similaire à celui trouvé par Samarina (2007) dans les langues du Caucase, qui s’explique par les différences de genre dans le mode de vie. Les femmes, qui sont généralement impliquées dans des pratiques nécessitant une attention particulière aux aliments, aux teintures et aux plantes, ont tendance à utiliser des termes de couleur indigènes et descriptifs. Les hommes, en revanche, s’impliquent dans le commerce et d’autres activités au-delà de l’environnement domestique, ce qui les amène à utiliser des termes de couleur plus abstraits et adoptés.
Cas 8 : Cakchiquel (L17)
La langue cakchiquel possède un terme, lila (w16), qui a une valeur Diff élevée, voir la cinquième ligne de la figure 11. Les femelles utilisent w16 pour désigner le » violet clair » ; les mâles utilisent w16 avec moins de fréquence et de cohérence pour décrire le même ensemble de couleurs. Cependant, nous pouvons voir que si les femelles utilisent w10 pour désigner les couleurs « violet foncé », les mâles utilisent w10 pour désigner toutes les couleurs dans la région « violet », y compris les variétés claires et foncées.
Exemplaires de catégories masculines et féminines
Dans Fider et al. (2017), nous exposons des méthodes pour identifier et analyser les exemplaires de catégories selon les données d’une tâche de dénomination des couleurs. En appliquant ces méthodes aux sous-populations féminines et masculines, nous avons constaté que, bien que dans certaines langues, les exemplaires masculins et féminins étaient différents, ce résultat n’était pas statistiquement significatif, dans le sens où des modèles similaires ont été observés dans des simulations avec des populations pseudo-masculines et pseudo-féminines sélectionnées au hasard. Il convient de noter que l’algorithme qui localise l’exemplaire d’une catégorie dépend de la recherche du centroïde tridimensionnel d’une collection de couleurs et de sa projection sur l’ensemble des couleurs WCS. La collection originale de couleurs provient de l’ensemble de couleurs WCS, qui est choisi principalement à partir de la « surface » d’un solide de couleur tridimensionnel ; le calcul du centre de masse et la projection sur la grille WCS introduisent un risque d’erreur, et les résultats apparemment aléatoires des exemplaires masculins/féminins pourraient simplement être une conséquence de ce problème. Les détails concernant nos méthodes et nos résultats basés sur les exemplaires se trouvent dans la section supplémentaire 4.
.