2014年6月6日金曜日

グレた確率統計 ~ポアソン分布~

これまでにしてきたことを少し振り返ってみましょう。
まず、ベルヌーイ試行から始まりました。ONかOFFか、YESかNOか、1か0か、というやつですね。それを複数回行ったときのONの数の確率分布を求めました(二項分布)。そして、初めてONが出たときの試行回数の確率分布も求めました(幾何分布)。畳み込みを踏まえた上で、幾何分布の一般形、すなわち r回ONが出たときの試行回数の確率分布も求めました(負の二項分布)。そのあと、連続化に進み、幾何分布を連続化しました(指数分布)。また、負の二項分布の連続化、もしくは指数分布の畳み込みを行いました(アーラン分布)。

二項分布、幾何分布、負の二項分布、指数分布、アーラン分布が、単純なベルヌーイ試行から導出されてきたことを見てきたわけです。

さて、今回は、次のような分布を求めてみます。すなわち、「単位時間で事象がk回起こる確率」です。

最も単純明快な導出方法は、おそらく、アーラン分布(ガンマ分布)を用いたものでしょう。

単位時間で事象がk回起こる確率というのは、t' < 1 なる t' でk回起こり、残りの時間は起こらなかった確率と言い換えられます。t = t' で k回起こる確率というのはガンマ分布、

$$\Gamma(t; r=k) = \frac{t^{k-1} \phi^{k} \exp(-\phi t)}{(k-1)!}$$

で表わせ、残りの時間、すなわち t = 1-t' で1回も起こらない確率$g_0(t)$は指数分布を用いて、

$$g_0(t) = 1-\int_0^t \phi \exp(-\phi t') dt' = \exp(-\phi t)$$

とできますから、この2つの畳込み、

$$Pr(X=k) = \int_0^1 \Gamma(t';r=k)\cdot g_0 (1-t')dt' \\ = \int_0^1 \frac{t'^{k-1} \phi^{k} \exp(-\phi t')}{(k-1)!} \cdot \exp(-\phi (1-t')) dt' \\ = \frac{\phi^k \exp(-\phi)}{(k-1)!} \int_0^1 t'^{k-1}dt' = \frac{\phi^k}{k!}  \exp(-\phi) $$

この分布をポアソン分布といい、意味としてはさきに書いた通り、「単位時間で事象がk回起こる確率」となります。



というわけで、主要な確率分布が以上のようにすべて繋がっているように考えられるということが分かります。


(多分おしまい)

グレた確率統計 ~ガンマ・アーラン分布~

前回は、幾何分布から指数分布へ、つまり離散型から連続型への変換をやりました。
幾何分布は畳み込むことで負の二項分布になりましたね。
もちろんのことながら、負の二項分布を連続化した分布も考えることができます。
さらに言えば、指数分布を畳み込むことで同じ分布が得られるはずです。
それこそがガンマ分布(厳密に言えばアーラン分布)なわけです。

そこで、ここではガンマ分布を2つのやり方
① 負の二項分布の連続化
② 指数分布の畳み込み
で導出してみます。



① 負の二項分布の連続化

負の二項分布は、
$$Pr(X=k) = ~{}_{k-1} \mathrm{C}_{r-1} ~ p^r q^{k-r}$$
と表わせ、「事象が試行k回目にちょうどr回生じる確率」の意味付けができます。
これを連続化すれば、おそらく
「事象が時間tのときにちょうどr回生じる確率分布」が得られるはずです。

まず、組み合わせの変形はそのままではやりづらいので、負の二項分布の自然対数を変形していくことにします。
また、非常に大きい数 x について、スターリンの近似式、
$$ \ln x! \approx x \ln x - x$$
が成り立つこと、そして、小さい数 x について、次の近似式が成り立ちます:
$$ \ln (1-x) \approx -x $$
$$\ln Pr(X=k) = \ln \left( ~{}_{k-1} \mathrm{C}_{r-1} ~ p^r q^{k-r} \right) = \ln \left( \frac{(k-1)!}{(k-r)! (r-1)!} ~ p^r q^{k-r} \right ) \\ = \ln{(k-1)!} ~- \ln(k-r)! ~-\ln(r-1)! ~+ r\ln p + (k-r)\ln q $$
スターリンの式で、$\ln(k-1)!$と$\ln(k-r)!$を近似し、$p=\phi dt$を代入すると
$$= (k-1)\ln(k-1)-(k-1) - (k-r)\ln(k-r) +(k-r) -\ln(r-1)!+r \ln(\phi dt)+(k-r)\ln(1-p)$$
ここで、次の近似、
$$\ln(k-a)=\ln k + \ln(1-a/k) \approx \ln k - \frac{a}{k} \\\ln(1-p) \approx -p = -\phi dt$$
を使うと、
$$= (k-1)\left(\ln k-\frac{1}{k}\right) - (k-r)\left(\ln k -\frac{r}{k}\right) +1-r -\ln(r-1)!+r \ln(\phi dt)-(k-r)\phi dt\\= (r-1)\ln k -\frac{1}{k} ((k-1)-r(k-r)) + 1-r -\ln(r-1)!+ r\ln\phi +r\ln dt -\phi t+r\phi dt$$
少し式が煩雑になってきたので、
$L = -\ln(r-1)!+r\ln\phi-\phi t$と置いて、式を整理していくと、
$$=(r-1)\ln k -\frac{1}{k} ((k-1)-r(k-r)) + 1-r +r\ln dt+r\phi dt + L\\=(r-1)(\ln t - \ln dt)-\frac{1+r^2}{k}+r\ln dt + r\phi dt +L\\=(r-1)\ln t + \ln dt - \left(\frac{(1+r)^2}{t} +r\phi \right )dt + L$$
ここで、Lというのは、
$$L = \ln \left( \frac{\phi^r \exp(-\phi t)}{(r-1)!}  \right )$$
と変形できるので、これを使って変形すると、
$$= \ln \left( \frac{t^{r-1} \phi^r \exp(-\phi t)dt}{(r-1)!} \right) - \left(\frac{(1+r)^2}{t} +r\phi \right )dt\\ \approx \ln \left( \frac{t^{r-1} \phi^r \exp(-\phi t)dt}{(r-1)!} \right) ~~(\because dt \ll 1)$$

よって、
$$Pr(T=t) = \frac{t^{r-1} \phi^r \exp(-\phi t)}{(r-1)!} dt$$
となり、$Pr(T=t) = \Gamma (t) dt $とすれば、確率密度 Γ(t) は、
$$ \Gamma (t) = \frac{t^{r-1} \phi^r \exp(-\phi t)}{(r-1)!} $$
となります。

② 指数分布の畳み込み

t秒後にちょうどk回起こる確率分布を$g_k(t)$とすると、k=2のときは2つの指数分布をたたみ込めばいいので、
$$g_2(t)=\int_0^t \left(\phi \exp(-\phi (t-t')) \right )\left(\phi \exp(-\phi t') \right )dt'\\ = \phi^2 \exp(-\phi t) \int_0^t ~dt' = t \phi^2 \exp(-\phi t)$$
となります。一応$g_3(t)$も求めてみると、これは$g_2(t)$と指数分布の畳み込みで求められ、
$$ g_3(t) = \int_0^t g_2(t') \phi \exp(-\phi(t-t')) dt' \\ = \int_0^t t' \phi^3 \exp(-\phi t) dt' = \frac{t^2 \phi^3 \exp(-\phi t)}{2!} $$
となります。

ここから帰納的に、
$$ g_k(t) = \frac{t^{k-1} \phi^k \exp(-\phi t)}{(k-1)!} $$
と仮定してみると、
$$g_{k+1}(t) = \int_0^t g_k(t') \phi \exp(-\phi(t-t'))dt' \\ = \int_0^t \frac{t'^{k-1} \phi^k \exp(-\phi t')}{(k-1)!} \cdot \phi \exp(-\phi(t-t')) dt' \\ = \frac{\phi^{k+1} \exp(-\phi t)}{(k-1)!} \int_0^t t'^{k-1} dt' = \frac{\phi^{k+1} \exp(-\phi t)}{(k-1)!} \cdot \frac{t^k}{k}\\ = \frac{t^k \phi^{k+1} \exp(-\phi t)}{k!} $$


ということで、やはりどちらの側からもガンマ分布が求められました。
ちなみに今回出した分布のパラメータ r は正の整数値をとりますが、実際のガンマ分布のパラメータ r は正の実数値を取ります。
そこで、正の整数値をとる場合の確率分布はアーラン分布と呼ばれています。ですから、これら一連の導出は厳密にはアーラン分布の導出ということになります。

さて、ガンマ分布の平均値と分散を求めてみましょう。愚直に計算してもいいのですが、どうせなら、負の二項分布を連続化、もしくは指数分布を畳み込んだものがガンマ分布ということを利用してみましょう。

負の二項分布の平均値と分散はそれぞれ、$\mu = r/p,~~ \sigma^2 = rq/p^2$となります。
ここに、変数変換 $T = X dt$を考慮しながら、 $p = \phi dt$ を代入すれば、
$$ E(T) = E(X dt) = E(X) dt = \frac{r dt}{p} = \frac{r}{\phi} \\ Var(T) = Var(X dt) = Var(X) dt^2 = \frac{r q dt^2}{p^2} = \frac{r}{\phi^2} $$
と求められます。

また、ガンマ分布に従う確率変数 Z と r個の指数分布に従う変数 $X_i$ は、
$ Z = X_1 + X_2 + ... + X_r$
であり、かつ、$X_i$ はそれぞれ独立なので、
$E(Z) = E(X_1 + X_2 + ... + X_r) = E(X_1) + E(X_2)+ ... + E(X_r) = r/\phi$
分散も同様に、
$Var(Z) = Var(X_1 + X_2 + ... + X_r) = Var(X_1) + Var(X_2)+ ... + Var(X_r) = r/\phi^2$
と求められます。

定義通りに求めるやり方は、練習問題としておきます。



グレた確率統計 ~指数分布の補足~

さて、前回の幾何分布と指数分布について少し補足したいと思います。


指数分布の導出過程で、
$$p = \frac{dt}{\mu}$$
と置きましたね。すなわち、ここでpは「微小時間間隔 dt で事象が起こる確率」となっています。
これは、T = X dt と置いたことからも分かります。
この式を少し眺めていると、

[確率] = [確率密度] × [微小時間]

の形に見えてきませんか?つまり、pと対応する確率密度 $\phi$ を、

$$ p = \phi dt $$
$$ \phi = p / dt = 1/\mu $$

と定義してやることができます。これを指数分布に代入してみると、
$$f(t) = \frac{1}{\mu}\cdot \mathrm{exp}(-t/\mu) = \phi \cdot \exp(-\phi t)$$
となります。指数分布の離散版ともいえる幾何分布が、
$$Pr(X=k)= pq^{k-1} ~~~ (p+q=1)$$
だったことを考えると、qの累乗と、指数部に対応付けがしたくなります。

具体例を考えてみると、たとえば幾何分布では、
$$Pr(X \geq  k) = 1 - \sum_{i=1}^{k}p(1-p)^{i-1} \\ = 1 - p\cdot\frac{1-q^{k}}{1-q} = 1- (1-q^k) = q^k$$
であり、これに対応する指数分布の場合を考えると、
$$Pr(T \geq  t) = 1 - \int_{0}^{t} \phi \exp(-\phi t') dt'\\= 1 - [-\exp(-\phi t')]_0^t = 1- (1- \exp(-\phi t)) = \exp(-\phi t)$$
となり、
$$q^k = \exp(-\phi t)$$
と関連づけれそうです。
導出過程のことを考えると、tにとって k と k-1 はほとんど変わらないので、
$$ f(t) = \phi \cdot \exp(-\phi t) $$
というのは、幾何分布において、
$$p \rightarrow \phi$$
$$q^{k-1} \rightarrow \exp(-\phi t)$$
と置き換えたものだとみれます。

もうひとつ、q と exp(-φt) の対応付けが妥当な例を見てみましょう:
$$ q^{k-1} = (1-p)^{k-1} = (1-\phi dt)^k = (1-\phi dt)^{t/dt} = \exp(-\phi t)$$
ここで、$1/({1-\phi dt}) \approx 1$, $k = t/dt$ を用いました。
最後の等式は、指数分布の導出でも用いた、ネイピア数の定義です。

ということで、幾何分布と指数分布の形式的な対応付けが与えられたことになります。
その結果、期待値と分散も幾何分布から指数分布への簡単な対応付けで得られるはずです。

2014年6月5日木曜日

基礎分子物理化学 - KEITH A. McLAUCHLAN

 
名前の通り、物理化学の基礎のテキストですが、巻末を抜いてなんと131ページしかない。
この本は副読本という立ち位置を狙っているそうで、確かにそのような内容。

普通物理化学というと、まずは熱力学なわけだが、この本はアプローチが異なる:

今日では原子や分子の存在及び特性は確立されており、個々の原子や分子に対して実験ができるようになっている。これにより、実験対象をこれまでと違った見方をすることができ、原子や分子の特性から、それら集合体の特徴的なふるまいを導き出せるようになる。これは、化学の学校レベルの教え方としてふさわしいと言える。
こういった分子論から物理化学を始めていく教科書は他にもたくさんあるが、まずこのテキストは量子論史に沿っていない。よく出てくるリュードベリ定数も出てこないし、光電効果やプランクの式も冒頭に出てこない。本書はまず、「原子・分子の熱容量(エネルギー)には何が関係してくるのだろうか」ということから始める。ゆえに、まず出てくる数式は原子の平均エネルギー( <E> = 3/2 kT)である。

そう考えると、本書は物理化学というよりは統計力学かもしれない。よく知られた量子力学の法則・定理・公式を素直に上げ、それらを用いて実測値は説明できるのかどうか、という視点からはじまる。

量子力学に真っ向から挑みたい人にはつまらないこと必至であるが、分光学、エネルギーの話等々、やや実学的に量子力学の役割を学ぶにはもってこいのテキストだと思う。