#freeze
*相関係数(correlation coefficient) [#k87fa7e9]
2 つの確率変数の間の相関(類似性の度合い)を示す統計学的指標である。単位は無く、-1 から 1 の間の実数値をとり、1 に近いときは2 つの確率変数には正の相関があるといい、-1 に近ければ負の相関があるという。0 に近いときはもとの確率変数の相関は弱い。因みに 1 もしくは -1 となる場合は 2 つの確率変数は線形従属の関係にある。
*歴史 [#u5500660]
1880年代に、フランシスガルトンと同様な方法で、ピアソンによってxとyの共分散Cov(x,y)を標準偏差σx,σyの積で割った値として定義された。''線形従属性の尺度である。''

*相関係数の意味 [#gbb0e41b]
相関係数を深く理解するには、データ列 (xi,yi),i=1~n に基づいて、yをxで推定する1次式を考えるとよくわかる。

-最小二乗法のページに詳しく解説しました。

*標本の相関係数と共分散 [#e0682289]
2 組の数値からなるデータ列 (xi,yi),i=1~n  があたえられたとき、相関係数Rは以下のように求められる。共分散をそれぞれの標準偏差で割ったものに等しい。

 相関係数 R = Cov(x,Y)/[σ(x)・σ(y)]
 但し、
 共分散= Cov(X,Y)= E[(x-E(x))(y-E(y)]
 分散 =V(x)=σ(x)^2=E[(x-E(x))^2]
#ref(soukann2.png)

*相関係数の例 [#e5cb65c5]
横軸をx、縦軸をyとして、(xi,yi)をプロットした時、相関係数は、下図のようになる。

#ref(corelation.JPG)

-yをy=ax+bで推定した時、''全変動(yの分散)の何割が、yの推定値で説明できたかの指標である''。
-相関係数の二乗を決定係数と呼ぶが、これは誤差二乗和と全変動で表わされる。
 R^2= 1 - 推定誤差二乗和/全変動
-相関係数が、最大+1、最小-1の場合は直線上に位置する。
-相関係数が0となるのは、水平に位置する場合、円板状に位置する場合などいろいろある。
--系列相関がある場合、例えば y=sinx の場合も相関係数は0となる。
全変動の内、何割が予測されたかを表わす指標である

トップ   編集 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS