Anscombe’s Quartet

グラフが個々の点の正確な値を示すことに関しては、興味深い発言であり、おそらく真実でしょう。

見てわかるように、4つのグループに分けられ、各グループにはxとyの値で11個のポイントがあります。 一見すると、最後のグループが一番わかりやすいように思えますが、この4つのグループがそれぞれどのように違うかというと、それは難しいでしょう。

これらのグループの特徴を、統計的な性質から見てみることもできます。

そしてこれが、アンスコムが彼のデータセットで本当に成功したところです。4つの異なるグループであるにもかかわらず、同じ特性を持っているので、統計を使うだけでそれらを説明するのは難しいのです。

最初のグループは線形関係にあるようです。

2番目のグループもxとyに関係を持っていますが線形ではありません。

第3グループも第1グループと同じ線形関係ですが、一番上の異常値を中心として、よりタイトな関係です。

最後のグループは他のグループとは大きく異なり、異常値が原因で統計特性が第1グループのように振る舞います。

このケースでは、データのテーブルを見るだけでは、それを視覚化するよりも価値が低いことを証明しています。 ただ、損益表のように可視化よりデータ表現の方がわかりやすい場合があるのは同意できる。

今回は以上です。”なぜ可視化するのか?”という質問を受けたら、その答えがわかるといいですね。

コメントを残す

メールアドレスが公開されることはありません。