離散分布からサンプリングする方法は？

Barry

2013-08-21 01:40:40 UTC

view on stackexchange narkive permalink

単一の確率変数Xからの可能な結果を支配する分布があると仮定します。これは、Xが1、2、3、4のいずれかの値である場合の[0.1、0.4、0.2、0.3]のようなものです。

この分布からサンプリングすることは可能ですか。つまり、その結果の確率が与えられた場合に、考えられる結果のそれぞれに疑似乱数を生成することは可能ですか。したがって、2を取得する確率を知りたい場合、サンプリング操作は0.34などを返す可能性があります。

私が尋ねる理由は、アクション選択ポリシーを実装しようとしているためです。研究論文に基づく強化学習法。私が論文から集めたものから、著者は「適応数値積分によって得られた累積確率密度関数を介して一様分布U [0,1]をマッピングする」ことによって分布をサンプリングすることができます。これから、彼は各試行の遷移確率をサンプリングします...

これに関する情報をいただければ幸いです...

よろしくお願いします

離散確率分布をサンプリングするには、さまざまな方法があります。このペーパーでは、累積分布関数を使用します（$ u <0.1 $が「1」を出力する場合、$ <0.1 + 0.4 $が「2」を出力する場合など、（0,1）で$ U = u $を生成します）。速度が問題になる場合（たとえば、何十億回もサンプリングしたい場合）、はるかに効率的な方法があります。

@Glen_b離散rvをサンプリングするためのより効率的な方法を挙げてください。これはとても興味深いです。

@Rigaは以下の私の答えを参照してください

ここに「エイリアスメソッド」を説明する素晴らしい記事があります：http：//www.keithschwarz.com/darts-dice-coins/

/ *不等確率サンプリング; with-replacement case * nはpとpermの長さです。 pには確率が含まれ、perm *には実際の結果が含まれ、ansにはサンプリングされた値の配列*が含まれます。 * / static void ProbSampleReplace（int n、double * p、int * perm、int nans、int * ans）{double rU; int i、j; int nm1 = n-1; / *要素IDを記録します* / for（i = 0; i < n; i ++）perm [i] = i + 1; / *確率を降順で並べ替えます* / revsort（p、perm、n）; / *累積確率を計算します* / for（i = 1; i < n; i ++）p [i] + = p [i-1]; / *サンプルを計算します* / for（i = 0; i < nans; i ++）{rU = unif_rand（）; for（j = 0; j < nm1; j ++）{if（rU < = p [j]）break; } ans [i] = perm [j]; }}