マルコフ過程とは †マルコフ性をもつ確率過程のことをいう。すなわち、未来の挙動が現在の値だけで決定され、過去の挙動と無関係であるという性質を持つ確率過程である。このような過程は例えば、確率的にしか記述できない物理現象の時間発展の様子に見られる。 アンドレイ・マルコフ †Andrey (Andrei) Andreyevich Markov、1856年6月14日 - 1922年7月20日、日付はいずれも新暦)は、ロシアの数学者。特に確率過程論に関する業績で知られる。彼の研究成果は、後にマルコフ連鎖として知られるようになった。 同じアンドレイ・アンドレイヴィッチ・マルコフという名前を持つ彼の息子(1903 - 1979)もまた著名な数学者であり、構成的数学や再帰関数論の発展に寄与した。 アンドレイ・アンドレイヴィッチ・マルコフは、リャザンの森林管理局長を勤めていたアンドレイ・グリゴールヴィッチ・マルコフと、その最初の妻であったナジェージダ・ペトローヴナ・マルコワの息子として、リャザンの地で生まれた。 1866年、サンクトペテルブルク第5グラマースクールに入学 グラマー・スクール在学中の17歳の時に、彼はヴィクトール・ブニャコフスキー、アレクサンドル・コルキン、イェゴール・ゾロタレフといった数学者に対して、線形常微分方程式の全く新しい解法を提案しており、その結果コルキンの学生らが集ういわゆる「コルキンの土曜日」に招待された。 1874年に学校を卒業すると、彼はサンクトペテルブルク大学で物理数学の研究を始めた。 修士号を得た後の1880年秋に始まった。彼は私講師として、微積分の講義を行った。後に彼は解析学の入門講座、確率論(1882年に退職したチェビシェフの後任)、差分法などの講義を受け持った。1895/96年から1905年まで彼はさらに微分法の講義も担当した。 1886年に彼は特任教授に指名され、さらに科学アカデミー会員にも推挙された。ブニャコフスキーの死後、1890年にはアカデミーの特別メンバーとなった。 1894年には母校サンクトペテルブルク大学で、(通常の)教授職を得ることができた。 1896年には、チェビシェフの後継としてアカデミーの一般メンバーに推挙された。1905年に彼はmerited professor となり退職の権利を得たが、彼はすぐにそれを行使した。とは言え、彼は1910年まで差分法の講義を続けた。 1908年、学生運動との関連により、サンクトペテルブルク大学の教授・講師は彼らの学生を監視するよう命じられた。マルコフは最初にこの命令を拒否し、なぜ彼が「支配者の代理人」となることを拒否するのかの説明文を著した。マルコフは大学でこれ以上教育を続けることを拒否され、結局大学からは完全に退職することになった。 1913年、サンクトペテルブルク大学の評議会は9人の科学者を名誉会員として推挙した。マルコフもその中に含まれていたが、教育省は彼の推薦を認めなかった。しかしそのわずか4年後、1917年の2月革命の後に、推薦は認められることになった。マルコフは教壇に戻り、1922年に死去するまで確率論と差分法の講義を続けた。 マルコフ性 †マルコフ性(英: Markov property)とは、確率論における確率過程の持つ特性の一種で、その過程の将来状態の条件付き確率分布が、現在状態のみに依存し、過去のいかなる状態にも依存しない特性を持つことをいう。すなわち、過去の状態が与えられたとき、現在の状態(過程の経路)は条件付き独立である。マルコフ性のある確率過程をマルコフ過程と呼ぶ マルコフ連鎖 †マルコフ連鎖とは、確率過程の一種であるマルコフ過程のうち、とりうる状態が離散的(有限または可算)なもの(離散状態マルコフ過程)をいう。また特に、時間が離散的なもの(時刻は添え字で表される)を指すことが多い(他に連続時間マルコフ過程というものもあり、これは時刻が連続である)。マルコフ連鎖は、未来の挙動が現在の値だけで決定され、過去の挙動と無関係である(マルコフ性)。各時刻において起こる状態変化(遷移または推移)に関して、マルコフ連鎖は遷移確率が過去の状態によらず、現在の状態のみによる系列である。 有限状態マルコフ連鎖 †状態空間が有限ならば、遷移確率分布は行列で表現され、これは遷移行列と呼ばれる。この行列Pの第(i, j)要素は に等しい。さらに、マルコフ連鎖が時間的に均一、つまり遷移行列Pが添え字 n によらないならば、k-段階遷移確率は遷移行列のk乗、つまりPk と書ける。 定常分布π は行ベクトルで、次の式を満たす: 言い換えると、定常分布π は遷移行列の正規化された左側固有ベクトルで、その固有値は 1 である。 もしくはπ を、行列Pに対応する単位単体上の線形(連続)変換での不動点と見ることもできる。単位単体上の任意の連続変換は不動点を持つから、定常分布は必ず存在するが、一般にただ1つであるという保証はない。しかし、マルコフ連鎖が既約かつ非周期的ならば、定常分布πがただ1つ存在する。 さらにPkが、各行が定常分布πであるような行列に収束するならば、 (ここで1はすべての成分が1である列ベクトル)となる(ペロン・フロベニウスの定理)。つまり、時間が経つにつれてマルコフ連鎖は、初期分布に関わりなく、定常分布に収束するということである。 状態推移図 †お天気の確率 †晴と雨の2通りの状態とします。今日の状態から明日の状態への推移は、次の推移確率行列A={aij}で表わせるとします。 a11=1/2:晴-->晴 a12=2/3:雨-->晴 a21=1/2:晴-->雨 a22=1/3:雨-->雨 この時、初期状態をx0=(0期に晴の確率、0期に雨の確率)とする。状態は、変数で定義すべきなので、X0=(θ0,1-θ0)'の確率ベクトルとしましょう。但しθ0(0<θ<1)です。 i期後の状態は、次のマルコフ連鎖で表わされる。 Xi+1=Axi =A^(i)x0 現在の状態は、前期の状態のみによって決まる(マルコフ性)から、任意の時点の状態も初期状態で、きまってくる。
固有値を用いた対角化 †
推移確率行列 に対して, P^n を計算してみよう.
ルーレット型ゲームのマルコフ連鎖 On a Markov chain roulette-type game †A Markov chain on non-negative integers which arises in a roulette-type game is discussed. The transition probabilities are p01 = ρ, pNj = δNj, pi,i+W = q, pi,i−1 = p = 1 − q, 1 ≤ W < N, 0 ≤ ρ ≤ 1, N − W < j ≤ N and i = 1, 2, ..., N − W. Using formulae for the determinant of a partitioned matrix, a closed form expression for the solution of the Markov chain roulette-type game is deduced. ロシアン ルーレット の数学的理論 †On the mathematical theory of splitting and Russian roulette techniques ランダム ウオーク 問題の例題 †Exercise of Stochastic Processes A roulette wheel has 18 red pockets, 18 black pockets and 1 green pockets. On each spin, the roulette ball falls randomly into one of the pockets. A player starts with £60 and wins £1 if the roulette ball falls into a red pocket, and loses £1 otherwise. The player continues until losing all the money or reaching the target of £100. What is the probability that the player reaches the target? If the player bets £5 each time instead of £1, then what is the probability of reaching the target of £100. In each of the situations described above, what is the expected duration of the game. If the player bets £5 each time instead of £1, then what is the probability of reaching the target of £100. In each of the situations described above, what is the expected duration of the game.
マルコフ過程 †A氏とB氏が、ホームページを持っている。当初、A氏の閲覧量は、2人合計の閲覧量の10%であった。B氏は90%なので、a0=0.1、bo=0.9で表そう。 ある時、A氏がとても良い記事を書いたので、B氏がリンクを参照したところ、その後、A氏の以前のシェアの90%を確保しつつ、B氏のシェアの20%が、A氏のページを見るようになった。 そして、B氏は残り80%のシェアを確保しつつ、A氏のシェアの10%がB氏のページを見るようになった。
上記は、ホームページの例題ですが、ビールや携帯などでも、最新時点の販売量のシェアと、最新の期間の販売シェアの推移行列を用いて、将来のシェアを予測し生産計画を立てる場合などにも、応用できます。 ガウス=マルコフの定理とは †あるパラメタを観測値の線形結合で推定するとき、残差を最小にするような最小二乗法で求めた推定値が、不偏で最小の分散を持つことを保証する定理である。 |