グラフが個々の点の正確な値を示すことに関しては、興味深い発言であり、おそらく真実でしょう。
見てわかるように、4つのグループに分けられ、各グループにはxとyの値で11個のポイントがあります。 一見すると、最後のグループが一番わかりやすいように思えますが、この4つのグループがそれぞれどのように違うかというと、それは難しいでしょう。
これらのグループの特徴を、統計的な性質から見てみることもできます。
そしてこれが、アンスコムが彼のデータセットで本当に成功したところです。4つの異なるグループであるにもかかわらず、同じ特性を持っているので、統計を使うだけでそれらを説明するのは難しいのです。
最初のグループは線形関係にあるようです。
2番目のグループもxとyに関係を持っていますが線形ではありません。
第3グループも第1グループと同じ線形関係ですが、一番上の異常値を中心として、よりタイトな関係です。
最後のグループは他のグループとは大きく異なり、異常値が原因で統計特性が第1グループのように振る舞います。
このケースでは、データのテーブルを見るだけでは、それを視覚化するよりも価値が低いことを証明しています。 ただ、損益表のように可視化よりデータ表現の方がわかりやすい場合があるのは同意できる。
今回は以上です。”なぜ可視化するのか?”という質問を受けたら、その答えがわかるといいですね。