É uma afirmação interessante e provavelmente é verdade que os gráficos são ásperos quando se trata de mostrar o valor exacto para cada ponto individual. Mas às vezes não são os valores individuais que são de interesse, mas sim o que mostra todo o conjunto de dados. Portanto, vejamos o seu conjunto de dados.
Como se pode ver está dividido em quatro grupos onde cada grupo tem onze pontos com um valor x e um y. De uma olhada nos diferentes grupos parece que o último grupo é o mais fácil de entender, mas seria difícil dizer como estes quatro grupos diferem uns dos outros.
Podíamos tentar olhar para as características destes grupos olhando para as suas propriedades estatísticas. Para estes grupos eles têm as mesmas propriedades ou propriedades muito semelhantes.
E é aqui que Anscombe realmente conseguiu com o seu conjunto de dados, apesar de serem quatro grupos diferentes eles têm as mesmas propriedades e por isso é difícil descrevê-los usando apenas estatísticas.
Vamos ver a representação visual e ver se conseguimos descrevê-los mais facilmente.
O primeiro grupo parece ter uma relação linear.
O segundo grupo também tem uma relação entre x e y,mas não é linear.
O terceiro grupo também tem uma relação linear como o primeiro grupo, mas é muito mais apertado com o outlier no topo sendo o estranho
O nosso último grupo parece muito diferente dos nossos outros e é o outlier que faz com que as propriedades estatísticas se comportem como os primeiros.
Neste caso nós provamos que apenas olhar para uma tabela de dados dá menos valor que fazer uma visualização da mesma. Mas posso concordar que há casos em que uma representação de dados é provavelmente mais fácil de entender do que uma visualização, tal como uma tabela de perdas de lucro.
É tudo por este tempo e espero que se você responder a pergunta “por que visualizar?”, você agora sabe a resposta.