VennDiagram : un paquet pour la génération de diagrammes de Venn et d’Euler hautement personnalisables en R

Presque toutes les options graphiques du paquet VennDiagram ont été paramétrées et rendues personnalisables. Les valeurs par défaut ont été sélectionnées pour générer des diagrammes raisonnables, de sorte que dans les cas simples, un haut niveau de personnalisation n’est pas nécessaire. La figure 1 met en évidence la diversité des paramétrages disponibles. Il existe quatre grands groupes de paramètres graphiques : shape-fill, shape-line, labels et titles. Le remplissage de la forme fait référence aux couleurs de chaque cercle ou ellipse. Toutes les couleurs disponibles dans l’environnement R peuvent être utilisées, et l’alpha-blending peut être ajusté sur une base par forme. Les lignes de forme sont les lignes qui entourent chaque cercle ou ellipse. Elles peuvent être totalement absentes (figure 1C), pleines (figures 1A et 1B), ou tout autre type de ligne disponible dans R (figure 1D). Leur couleur peut être modifiée, et chaque forme peut avoir un ensemble de paramètres distinct. Les étiquettes font référence à la fois aux légendes décrivant chaque cercle ou ellipse et aux nombres qui les composent. Là encore, elles peuvent être personnalisées en termes de couleur, de type et de taille de police avec n’importe quel paramètre R disponible. La position des étiquettes des légendes peut également être personnalisée. Les titres, qui comprennent le titre principal et le sous-titre comme démontré dans la figure 1D, peuvent également être personnalisés de la même manière que les étiquettes.

Figure 1
figure1

Les quatre types de diagrammes de Venn dessinés par le paquet VennDiagram. A) Un diagramme de Venn à un ensemble montrant des fonctionnalités personnalisables rudimentaires telles que la taille de la police des étiquettes, la face de la police des étiquettes et le remplissage des formes. B) Un diagramme de Venn à deux ensembles présentant des fonctionnalités plus avancées telles que la mise à l’échelle, les spécifications individuelles de remplissage de forme et le placement individuel des étiquettes de légende. C) Un diagramme de Venn à trois ensembles montrant un type de ligne de forme différent (« transparent ») et l’option « texte » du placement des étiquettes de légende où les étiquettes de légende sont attachées aux étiquettes de zone. D) Un diagramme de Venn à quatre ensembles montrant une combinaison de toutes les caractéristiques précédentes plus la possibilité de personnaliser les titres. Le code pour générer tous les diagrammes présentés ici est inclus dans le fichier supplémentaire 3.

Au delà de ces éléments graphiques spécifiques, VennDiagram offre également de nombreuses options générales, telles que la mise à l’échelle, la rotation ou l’inversion des diagrammes. La mise à l’échelle des diagrammes a été implémentée dans le but d’afficher des diagrammes de Venn où les tailles graphiques des zones partielles (zones délimitées de tous les côtés par des courbes et qui ne peuvent pas être subdivisées davantage) correspondent réellement aux valeurs numériques du nombre d’éléments dans chaque région. La mise à l’échelle des diagrammes de Venn à deux ensembles et d’un certain nombre de diagrammes de Venn à trois ensembles est possible – nous discutons ci-dessous des difficultés à rendre cela possible pour tous les cas à trois ensembles. L’utilisation de la mise à l’échelle peut parfois conduire à des zones de chevauchement trop petites pour les étiquettes numériques. La figure 2, ligne 1, colonne 1, montre une ligne de connexion générée par le programme qui permet de traiter ce cas de façon particulière. La reconnaissance automatique d’un grand nombre de diagrammes d’Euler est implémentée, mais ce mode peut être désactivé avec un paramètre d’appel de fonction pour tracer des diagrammes de Venn standard à la place. La figure 2, ligne 1, colonnes 2 et 3 montre deux exemples de diagrammes d’Euler à deux ensembles. Les lignes 2 et 3 montrent un sous-ensemble de diagrammes d’Euler à trois ensembles implémentés, la ligne 3 montrant ceux de la variété évolutive. Nous notons que la figure 2 est présentée en noir et blanc pour mettre en évidence les différences de composition entre les diagrammes, mais les paramètres graphiques et les personnalisations utilisés dans la figure 1 sont entièrement disponibles. Bien que VennDiagram écrive par défaut les graphiques dans des fichiers TIFF haute résolution, si le paramètre filename est défini à NULL, l’objet grille brut peut être renvoyé et utilisé dans n’importe quel mode graphique disponible dans R. Le code pour générer toutes les figures est donné dans le fichier additionnel 3 et un exemple de toutes les paramétrisations disponibles est montré dans le fichier additionnel 4.

Figure 2
figure2

Cas particuliers sélectionnés de diagrammes de Venn et diagrammes d’Euler dessinés par le paquet VennDiagram. Rangée 1, colonne 1 : lignes personnalisables dessinées automatiquement qui optimisent l’affichage des zones partielles lorsque les zones partielles individuelles deviennent trop petites dans les diagrammes de Venn à deux ensembles. Ligne 1, colonne 2 : un diagramme d’Euler à deux ensembles montrant l’inclusion totale d’un des ensembles. Ligne 1, colonne 3 : un diagramme d’Euler à deux ensembles montrant deux ensembles distincts. Ligne 2, colonne 1 : un diagramme d’Euler à trois ensembles où l’un des ensembles n’a pas d’éléments discrets. Ligne 2, colonne 2 : un diagramme d’Euler à trois ensembles où un ensemble n’a pas d’éléments discrets et est totalement inclus dans l’un des deux autres ensembles. Ligne 2, colonne 3 : un diagramme d’Euler à trois ensembles où deux ensembles n’ont pas d’éléments discrets et sont inclus dans un troisième ensemble plus grand. Ligne 3, colonne 1 : un diagramme d’Euler à trois ensembles montrant l’inclusion totale de deux ensembles qui sont distincts du troisième ensemble. Ligne 3, colonne 2 : un diagramme d’Euler à trois ensembles où un ensemble est totalement inclus dans un autre ensemble, qui est lui-même totalement inclus dans le troisième ensemble. Ligne 3, colonne 2 : un diagramme d’Euler à trois ensembles montrant trois ensembles distincts. Le code pour générer tous les diagrammes montrés ici est inclus dans le fichier supplémentaire 3.

Discussion

Pendant le développement du paquet VennDiagram, il a été découvert qu’il était impossible de dessiner des diagrammes de Venn précis et à l’échelle avec trois ensembles en utilisant des cercles. Cette énigme est illustrée dans le scénario suivant. Dans un système de deux cercles A et B, les distances entre les centres des cercles, dAB, peuvent être déterminées à condition que les aires (AA et AB respectivement) et l’aire d’intersection (AA ∩ AB) soient toutes deux connues. Cela est possible car, dans un système à deux cercles, un seul AA ∩ AB correspond à une valeur unique de dAB. Par conséquent, dans un système à trois cercles A, B et C, dAB, dBC, dAC pourraient être calculés tant que AA, AB, AC, AA ∩ AB, AA ∩ AC, AB ∩ AC sont tous connus. Cependant, dAB, dBC, dAC forment un triangle unique, ce qui implique que l’on peut tracer un diagramme de Venn sans jamais connaître l’intersection globale AA ∩ AB ∩ AC. En d’autres termes, la taille du chevauchement entre les trois cercles ne modifie pas la présentation des diagrammes de Venn à l’échelle — l’aire reste inchangée même si l’un des systèmes a une intersection globale nulle (c’est-à-dire AA ∩ AB ∩ AC = 0) ! Cette énigme résulte du choix (arbitraire) de cercles pour représenter la taille de l’ensemble, ce qui réduit les degrés de liberté d’une unité. Des solutions uniques peuvent être identifiées en utilisant des ellipses ou des polygones pour dessiner les diagrammes de Venn, mais les diagrammes résultants perdraient la reconnaissance immédiate et la familiarité associées aux diagrammes de Venn circulaires, ce qui irait à l’encontre de l’objectif d’un affichage pratique des informations. Les diagrammes non circulaires nécessiteraient également des algorithmes itératifs pour calculer les positions et les tailles des formes, ce qui augmenterait considérablement les charges de calcul, comme cela a été discuté par d’autres personnes. Par conséquent, la mise à l’échelle des diagrammes de Venn à trois ensembles est désactivée dans le paquetage VennDiagram. De même, les diagrammes de Venn contenant plus de quatre ensembles n’ont pas été implémentés dans le package VennDiagram car ils deviennent trop complexes pour une visualisation intuitive.

Une mise en garde générale lors de l’utilisation des diagrammes d’Euler est que, bien qu’ils réduisent la complexité graphique de certains diagrammes de Venn, leurs formes non traditionnelles peuvent également être moins reconnaissables dans certains cas. En présence de zones vides, l’utilisateur doit choisir entre la familiarité des diagrammes de Venn et la précision accrue des diagrammes d’Euler. La figure 3 illustre une situation où un diagramme de Venn ou d’Euler peut être approprié selon les préférences de l’utilisateur.

Figure 3
figure3

Une comparaison côte à côte d’un diagramme d’Euler et d’un diagramme de Venn pour les mêmes ensembles hypothétiques. A) Le diagramme d’Euler ne montre que les zones non nulles et peut donc être plus précis graphiquement. B) Le diagramme de Venn montre la zone inexistante comme une zone à contenu nul. Bien que cela ne soit pas graphiquement précis, cela préserve la reconnaissabilité d’un diagramme de Venn.

Le paquet VennDiagram gère tous les diagrammes d’Euler à deux ensembles et la majorité de tous les diagrammes d’Euler à trois ensembles concevables. Les diagrammes d’Euler à trois ensembles qui ne pourraient pas être dessinés en utilisant des cercles ou des ellipses ne sont pas pris en charge. Par exemple, un diagramme d’Euler pour le cas où deux ensembles non intersectés comprennent le troisième ensemble ne peut pas être dessiné en utilisant des cercles et des ellipses, bien qu’il puisse être dessiné en utilisant des polygones. Ce type de figure n’a pas de disposition analytique prête et nécessiterait un ajustement itératif ; aucun diagramme d’Euler nécessitant des polygones n’est disponible, mais des diagrammes de Venn standard sont disponibles pour ces quelques cas non supportés.

Après comparaison avec d’autres programmes capables de générer des diagrammes de Venn (tableau 1), les avantages du paquet VennDiagram incluent :

  • Dessiner des diagrammes d’Euler en utilisant des cercles et/ou des ellipses avec deux ou trois ensembles

  • Offrir une plus grande personnalisation pour générer des diagrammes plus élégants

  • Disponibilité dans l’environnement statistique R largement utilisé

  • .utilisé dans l’environnement statistique R

  • Générer des fichiers TIFF haute résolution qui sont standards dans les publications

Tableau 1 Une comparaison des caractéristiques de divers programmes capables de générer des diagrammes de Venn.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.