散布図とは、縦軸と横軸に量や大きさを取り、データを当てはまるところにプロットしたグラフのことです。プロットとは、点を描くことを指します。二つの変数に関係があるかどうかを、点の散らばりから確認する手法となります。

点の散らばりが右肩上がりの傾向を示すことを正の相関と言い、右肩下がりなら負の相関と言います。点の散らばりが一定の傾向を示さなければ無相関と言います(図1)。

相関係数とは、2種類のデータ間の関連性の強さを示す指標です。より詳細に説明するとy=ax+bという一次関数の式で示されるような、直線的な相関関係の強さを示します。つまり相関係数によって、どれだけ直線関係に近いかがわかるわけです。ばらつきが大きければ「相関が弱い」と言い、ばらつきが小さければ「相関が強い」と言います(図2)。

相関係数はマイナス1からプラス1までの値をとります。プラスでもマイナスでも絶対値が大きければ大きいほど相関があるということになりますが、標本の数によって有意な水準が異なります。標本数別の限界値を示した便利な表があります(表1)。

1%の有意水準で評価すると、都道府県別のデータを検討する場合は、標本数は「47」ですので、相関係数は±0.4以上で有意な相関、5%の有意水準だと±0.3以上で有意な相関ということになります。注意しなければならないのは、相関があるからと言って、必ずしも因果関係があるとは限らないということです。因果関係を示唆する論理的な説明が必要になると思います。