Es una afirmación interesante y probablemente cierta que los gráficos son toscos cuando se trata de mostrar el valor exacto de cada punto individual. Pero a veces no son los valores individuales los que interesan, sino lo que muestra el conjunto de datos.Así pues, echemos un vistazo a su conjunto de datos.
Como puedes ver está dividido en cuatro grupos donde cada grupo tiene once puntos con un valor x y otro y. De un vistazo a los diferentes grupos parece que el último grupo es el más fácil de entender, pero sería difícil decir en qué se diferencian estos cuatro grupos.
Podríamos tratar de ver las características de estos grupos mirando sus propiedades estadísticas. Para estos grupos tienen las mismas propiedades o muy similares.
Y aquí es donde Anscombe realmente tuvo éxito con su conjunto de datos, a pesar de ser cuatro grupos diferentes tienen las mismas propiedades y por lo tanto es difícil describirlos sólo usando la estadística.
Veamos la representación visual y veamos si podemos describirlos más fácilmente.
El primer grupo parece tener una relación lineal.
El segundo grupo también tiene una relación entre x e y, pero no es lineal.
El tercer grupo también tiene una relación lineal como el primer grupo, pero es mucho más ajustada y el valor atípico de la parte superior es el extraño
Nuestro último grupo tiene un aspecto muy diferente a los demás y es el valor atípico el que hace que sus propiedades estadísticas se comporten como las de los primeros.
En este caso sí demostramos que sólo mirar una tabla de datos da menos valor que hacer una visualización de los mismos. Pero puedo estar de acuerdo en que hay casos en los que una representación de datos es probablemente más fácil de entender que una visualización, como por ejemplo una tabla de pérdidas de beneficios.
Esto es todo por esta vez y espero que si te surge la pregunta «¿por qué visualizar?», ahora sepas la respuesta.