Anscombe kvartettje

Érdekes kijelentés, és valószínűleg igaz is, hogy a grafikonok durvaak, amikor az egyes pontok pontos értékét kell megmutatni. De néha nem az egyes értékek érdekesek, hanem az, hogy mit mutat a teljes adathalmaz.” Nézzük meg tehát az ő adathalmazát.

Mint láthatjuk, négy csoportra van osztva, ahol minden csoportnak tizenegy pontja van, egy x és egy y értékkel. A különböző csoportokra pillantva úgy tűnik, hogy az utolsó csoport a legkönnyebben érthető, de nehéz lenne megmondani, hogy ez a négy csoport miben különbözik egymástól.

Megpróbálhatnánk megnézni ezeknek a csoportoknak a jellemzőit úgy, hogy megnézzük a statisztikai tulajdonságaikat. Ezeknek a csoportoknak ugyanolyan vagy nagyon hasonló tulajdonságaik vannak.”

És ez az, amiben Anscombe igazán sikeres volt az adathalmazával, annak ellenére, hogy négy különböző csoportról van szó, ugyanazokkal a tulajdonságokkal rendelkeznek, és ezért nehéz leírni őket pusztán a statisztika segítségével.

Nézzük meg a vizuális ábrázolást, hátha könnyebben leírhatjuk őket.

Az első csoportnál úgy tűnik, hogy lineáris kapcsolat van.

A második csoportnál szintén van kapcsolat x és y között,de ez nem lineáris.

A harmadik csoportnak is van lineáris kapcsolata, mint az elsőcsoportnak, de sokkal szorosabb, a tetején lévő kiugró a furcsa

Az utolsó csoportunk nagyon másképp néz ki, mint a többi, és a kiugró miatt a statisztikai tulajdonságai úgy viselkednek, mint az elsőké.

Ez esetben bebizonyítjuk, hogy az adatok táblázatának puszta megtekintése kevesebb értéket ad, mint azok vizualizálása. De azzal egyet tudok érteni, hogy vannak olyan esetek, amikor egy adatreprezentáció valószínűleg könnyebben érthető, mint egy vizualizáció, például egy profit-veszteség táblázat.

Ezúttal ennyi, és remélhetőleg ha felmerül a kérdés, hogy “miért érdemes vizualizálni?”, akkor most már tudja a választ.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.