正規乱数の生成
中心極限定理
中心極限定理とは下記のとおり。
赤本からの引用です。
母集団分布が何であっても、確率変数の和の確率分布の形はが大なるときには大略正規分布と考えてよい。例えば、上記の確率変数が平均、分散に従うとする時、
もしくは、
和の期待値と分散は次のようになります。についても同様に導出できます。
なんとなく、どんな母集団の分布でも標本数を増やすと正規分布になる、みたいな誤解がありそうですが、そんなことはなく、誤解を恐れずに言うと、標本の和や平均が正規分布に近づいていくということです。
標準正規分布に従う乱数の生成
ボックスミューラーの正規乱数生成については紹介しましたが、今回は上記の中心極限定理を使って生成したいと思います。
中心極限定理では、元の母集団はなんでもよいとのことですので、一様分布に従う確率変数を考えます。この一様分布の確率変数を個サンプリングすると、その平均はに従います。
次には一様分布に従うので、その期待値と分散は次のようになります。
以上から、一様分布から個のサンプルを拾ってきて和を取ったは正規分布に従います。
さらにこれを標準化します。実際の値をとすると、その和はと表現できるので、標準化した値は次のようになります。
標準化したので、は標準正規分布に従います。では実装してみましょう。
#!/usr/bin/env perl use strict; use warnings; # perl random.pl > random_out.dat my $n = 12; my @random_numbers; for my $i ( 1..1000 ) { # 1000個の乱数を生成 my $sum_r = 0.0; for my $j ( 1..$n ) { $sum_r += rand(1); # 一様乱数の生成と足し合わせ } my $z = ($sum_r - $n/2)/sqrt($n/12); push @random_numbers, $z; } for my $k( @random_numbers ) { print $k."\n"; }
gnuplotを使ってヒストグラムを書きました。引用も追加しておきます。
set terminal png set output 'random_out.png' binwidth =0.5 bin(x,width)=width*floor(x/width)+width/2.0 plot [-4:4] 'random_out.dat' using (bin($1,binwidth)):(1.0) smooth freq with boxes title 'random\_out.dat'
それっぽく生成されています。
ちなみに、今回はを12として、1000個の正規乱数を生成しています。実はとすると、になるので、式が簡単になり、平方根の計算は入りません。コードは簡略化していませんが。
変数変換による正規分布に従う乱数の生成
標準正規分布の乱数を作りましたが、次にのような一般的な正規分布を作ります。
と言っても非常に簡単です。変数変換を施して生成します。生成したい平均、分散の正規乱数を、標準正規分布に従う変数をとします。
上記のを生成して、を乗じて、を足し込めば完成です。さて実装です。
#!/usr/bin/env perl use strict; use warnings; # perl random_g.pl > random_out_g.dat my $n = 12; my $mu = 10.0; my $sigma2 = 5.0; my $sigma = sqrt($sigma2); my @random_numbers; for my $i ( 1..1000 ) { # 1000個の乱数を生成 my $sum_r = 0.0; for my $j ( 1..$n ) { $sum_r += rand(1); # 一様乱数の生成と足し合わせ } my $z = ($sum_r - $n/2)/sqrt($n/12); my $x = $mu + $sigma * $z; push @random_numbers, $x; } for my $k( @random_numbers ) { print $k."\n"; }
set terminal png set output 'random_out.png' binwidth =0.5 bin(x,width)=width*floor(x/width)+width/2.0 plot [0:20] 'random_out_g.dat' using (bin($1,binwidth)):(1.0) smooth freq with boxes title 'random\_out\_g.dat'