相関係数(correlation coefficient) †2 つの確率変数の間の相関(類似性の度合い)を示す統計学的指標である。単位は無く、-1 から 1 の間の実数値をとり、1 に近いときは2 つの確率変数には正の相関があるといい、-1 に近ければ負の相関があるという。0 に近いときはもとの確率変数の相関は弱い。因みに 1 もしくは -1 となる場合は 2 つの確率変数は線形従属の関係にある。 歴史 †1880年代に、フランシスガルトンと同様な方法で、ピアソンによってxとyの共分散Cov(x,y)を標準偏差σx,σyの積で割った値として定義された。線形従属性の尺度である。 相関係数の意味 †相関係数を深く理解するには、データ列 (xi,yi),i=1~n に基づいて、yをxで推定する1次式を考えるとよくわかる。
標本の相関係数と共分散 †2 組の数値からなるデータ列 (xi,yi),i=1~n があたえられたとき、相関係数Rは以下のように求められる。共分散をそれぞれの標準偏差で割ったものに等しい。 相関係数 R = Cov(x,Y)/[σ(x)・σ(y)] 但し、 共分散= Cov(X,Y)= E[(x-E(x))(y-E(y)] 分散 =V(x)=σ(x)^2=E[(x-E(x))^2] 相関係数の例 †横軸をx、縦軸をyとして、(xi,yi)をプロットした時、相関係数は、下図のようになる。
|