ピタゴラス †ピタゴラス(BC582?–BC497?) は、有名な言葉「万物は数である」と仲間たちに教えていた。 そして、その集団のシンボルは、ペンタグラム(正5角形と対角線が作る星型)であった。
ピタゴラスの定理:Pythagorean theorem †直角三角形の3辺の長さの関係を表す等式である。三平方の定理とも呼ばれる。 直角三角形の斜辺の長さを c とし、その他の辺の長さを a, b とした時 a^2+b^2=c^2 なる関係が成立するという幾何学の定理である.
詳細--->ピタゴラス数 余弦定理 †余弦定理は、ピタゴラスの定理を一般の三角形に、一般化したものとみなせる。 △ABC において、a = BC, b = CA, c = AB, α = ∠CAB, β = ∠ABC, γ = ∠BCA としたとき a2 = b2 + c2 − 2bccosα b2 = c2 + a2 − 2cacosβ c2 = a2 + b2 − 2abcosγ が成り立つ。
相関係数、誤差最小化とピタゴラスの定理:ベクトル表示 †相関係数とは、2つのデータの関係を表わす指数であり、-1から+1の間の実数で示される。 この意味を分かりやすく説明したい。 体重xでウエストyが説明できるか?という問題を考えてみよう。 xを説明変数、yを従属変数と呼ぶ。 関数 Y=aX+b を考える。 n人のデータ(xi,yi),i=1~nが得られたので、x-y平面上にプロットする。 ここで、体重ベクトル x=(x1,x2,・・・xn)とウエストベクトルy=(y1,y2,・・・yn)で表わすことにする。 体重ベクトルをa倍したウェストの推定値ベクトル ax+b は一般に観測ベクトルyとはズレがある。そこでこのズレを誤差と呼び、誤差ベクトルe=y-y* で表わすものとしよう。 誤差を少なくするようなパラメータa,bを求める問題(パラメータ推定問題)を考える。誤差の平方和をF(a,b)=Σei^2 最小にするようなa,bをa*,b*で表わし、最適なパラメータと呼ぶ。 以上を整理すれば パラメータ推定問題とは、次の誤差最小化問題 F(a,b)= Σei^2 --->Minimize by a yi= axi +b +ei (xi,yi),i=1~n 所与。
推定の意味:直交射影の原理=ピタゴラスの定理 †以上より、要約すると 推定式は y=σxy/σx^2・(x-μx) + μy となる。
相関係数の意味=ピタゴラスの定理 †すでにしめした定理 y^2 = e^2 + y*^2 :ピタゴラスの定理 の両辺から、μy^2を引くと、y-μyとy*-μyの二乗和で表わせる。 ベクトル表示すれば、 |y-μy|^2=|y-y*|^2 + |y*-μy|^2 推定誤差ベクトルとy*-μyベクトルが直交しており、これらの合成がy-μyである。これがピタゴラスの定理を表わす。 この意味を考えてみよう。 決定係数R^2は次式で定義されるので、 R^2= Σ(yi*-μy)^2 / Σ(yi-μy)^2 このことから,ベクトル表示式に代入すれば、決定係数と推定誤差二乗和の関係がわかる。 R^2 = 1 - (yの推定誤差の二乗和) これで、推定誤差の2乗和を最小にするようにすることは、相関係数が最大になるようにパラメータを決めることである。 また、R^2は1より小さい正の数であるので、Rは-1から+1の範囲であることも分かる。 決定係数、相関係数、推定誤差二乗和の関係 †決定係数Dは、次式で定義される。 D= Σ(yi*-μy)^2 / Σ(yi-μy)^2 また、これを最適推定式 y=σxy/σx^2・(x-μx) + μy で書き直してみよう。 D= [σxy/σx^2]^2・Σ(xi-μx)^2 / Σ(yi-μy)^2 = σxy^2/[σx^2・σy^2] =R^2 なぜならば 相関係数 Rが次式で定義されている。 R=σxy/[σx・σy] そこで 決定係数=(相関係数)^2= 1-(推定誤差の二乗和)/(yの分散) の関係があることがわかる。 決定係数とは、相関係数の二乗であり、1から標準化した推定誤差二乗和を引いたものに等しい。そこで、これを最大にするように決めることは、推定誤差二乗和を最小にすることと等価である。 |