Det er et interessant udsagn og sandsynligvis sandt, at grafer er grove, når det gælder om at vise den nøjagtige værdi for hvert enkelt punkt. Men nogle gange er det ikke de enkelte værdier, der er interessante, men derimod hvad hele datasættet viser, så lad os tage et kig på hans datasæt.
Som du kan se er det opdelt i fire grupper, hvor hver gruppe har elleve punkter med en x- og en y-værdi. Ud fra et blik på de forskellige grupper ser det ud til at den sidste gruppe er den letteste at forstå, men det vil være svært at sige hvordan disse fire grupper adskiller sig fra hinanden.
Vi kunne forsøge at se på disse gruppers karakteristika ved at kigge på deres statistiske egenskaber. For disse grupper har de de samme eller meget ens egenskaber.
Og det er her Anscombe virkelig lykkedes med sit datasæt, på trods af at de er fire forskellige grupper har de de samme egenskaber, og det er derfor svært at beskrive dem bare ved hjælp af statistik.
Lad os tage et kig på den visuelle repræsentation og se, om vi lettere kan beskrive dem.
Den første gruppe ser ud til at have en lineær sammenhæng.
Den anden gruppe har også en sammenhæng mellem x og y,men den er ikke lineær.
Den tredje gruppe har også en lineær sammenhæng som den første gruppe, men den er meget strammere med udbryderen i toppen som den mærkelige
Vores sidste gruppe ser meget anderledes ud end vores andre, og det er udbryderen, der gør, at dens statistiske egenskaber opfører sig som de første.
I dette tilfælde beviser vi, at det giver mindre værdi blot at se på en tabel med data end at lave en visualisering af dem. Men jeg kan godt være enig i at der er tilfælde hvor en datarepræsentation nok er nemmere at forstå end en visualisering, som f.eks. en tabeltabel for tab af overskud.
Det er alt for denne gang, og hvis du forhåbentlig får spørgsmålet “hvorfor visualisere?”, kender du nu svaret.