Anscombe’s Quartet

Det är ett intressant påstående och förmodligen sant att grafer är grova när det gäller att visa exakta värden för varje enskild punkt. Men ibland är det inte de enskilda värdena som är intressanta, utan snarare vad hela datasetet visar. så låt oss ta en titt på hans dataset.

Som du kan se är det uppdelat i fyra grupper där varje grupp har elva punkter med ett x- och ett y-värde. Vid en titt på de olika grupperna verkar det som om den sista gruppen är lättast att förstå, men det skulle vara svårt att säga hur dessa fyra grupper skiljer sig från varandra.

Vi skulle kunna försöka titta på egenskaperna hos dessa grupper genom att titta på deras statistiska egenskaper. För dessa grupper har de samma eller mycket liknande egenskaper.

Och det är här som Anscombe verkligen lyckades med sitt dataset, trots att de är fyra olika grupper har de samma egenskaper och det är därför svårt att beskriva dem bara med hjälp av statistik.

Låt oss ta en titt på den visuella representationen och se om vi lättare kan beskriva dem.

Den första gruppen verkar ha ett linjärt samband.

Den andra gruppen har också ett samband mellan x och y,men det är inte linjärt.

Den tredje gruppen har också ett linjärt samband som den första gruppen, men det är mycket snävare med utfallaren högst upp som den udda

Vår sista grupp ser väldigt annorlunda ut än våra andra och det är utfallaren som gör att dess statistiska egenskaper beter sig som de första.

I det här fallet bevisar vi att det är mindre värdefullt att bara titta på en tabell med data än att göra en visualisering av dem. Men jag kan hålla med om att det finns fall där en datarepresentation förmodligen är lättare att förstå än en visualisering, till exempel en vinsttabell.

Det var allt för den här gången och förhoppningsvis om du får frågan ”varför visualisera?” vet du nu svaret.

Lämna ett svar

Din e-postadress kommer inte publiceras.