質問:
$ 1- \ text {mean}(| A-B |)$の確率分布は何ですか?ここで、$ A $と$ B $は独立したU(0,1)ですか?
David Webb
2014-10-22 12:17:15 UTC
view on stackexchange narkive permalink

私は統計に精通していないので、私の質問が正確に表現されているかどうかはわかりませんが、基本的に私が解決しようとしている問題は次のとおりです。サイズnの同じサイズの配列が2つあると想像してください。各配列には0から1までの乱数が入力されます。次に、配列が相互に減算され、絶対値が取得されます。次に、この配列の平均値が計算され、この値が1から減算されます。このプロセスがT試行に対して繰り返され、値がヒストグラムでプロットされて分布が視覚化されます。上記の分布と、分布の平均および標準偏差を与える方程式が必要です。私はオンラインで広範囲に検索して、役に立たない答えを見つけようとしました。以下に、サイズ8と100,000回の試行の配列に対して私が話していることを実行するいくつかのmatlabコードを示します。

  clcclearalln = 8; T = 100000; H = zeros(1、 T); for i = 1:TA = rand(1、n); B = rand(1、n); H(i)= mean(1-abs(AB)); endhistfit(H、100); Minimum = min(H)Maximum = max(H)Mean = mean(H)Standard_Deviation = std(H) 

試行が増えると平均が2/3に近づき、配列サイズnが増えると標準偏差が減少することがわかります。 n = 8の場合、約8.33です。正常に見えますが、完全ではありません。

助けてくれてありがとう。

最小最大平均と標準は独自の線上にあるはずです
n = 8での標準偏差は、8.33ではなく約0.0833(実際には正確に1/12である必要があります)である必要があります。
二 答え:
Glen_b
2014-10-22 16:32:47 UTC
view on stackexchange narkive permalink

$ A-B $は、$(-1,1)$上に対称三角分布を持ちます。平均が0で、分散が$ \ frac {1} {6} $です。

$ | A-B | $の分布は$ \ text {beta}(1,2)$です。平均$ \ frac {1} {3} $と分散$ \ frac {1} {18} $があります。

ベータ確率変数の合計の分布は$ n = 2 $で知られています。 ( 1を参照)。

編集:

実際、この特定のベータ版は非常に単純なので、積分を実行できます。理由はわかりません。以前にそれを試してみませんでした。 $ Y_i = | A_i-B_i | $とします。 $ Z = Y_1 + Y_2 $の密度を計算でき、そこから$ 1- \ frac {1} {2} \ sum_ {i = 1} ^ 2 | A_i-B_i | $の分布を見つけることができます。

(畳み込み積分の)単純な直接積分により、

$ f_Z(z)= \ begin {cases} \ frac {2} {3} z \、(z ^ 2 -6z + 6)& \ mbox {for} 0<z \ leq 1 \\\ frac {2} {3}(2-z)^ 3 & \ mbox {for} 1<z \ leq 2 \\ 0 & \ mbox {elsewhere }。 \ end {cases} $

enter image description here

この場合、$ H_2 = 1-Z / 2 $の密度は、その密度の線形再スケーリングにすぎません。

[これは非常に急速に扱いにくくなります。私がこれを正しく行った場合、4つの$ Y_i $の合計はそれぞれ7次多項式で構成される4つの部分を持ち、8つはそれぞれ15次の多項式で構成される8つの部分を持ちます。優れた数式処理システムが手元にあれば、確かに計算できますが、有益なとは思えません。]

-

中程度の$ n $の場合、この比較的単純なケースでさえ代数的には知られていないと思いますが、数値的に、かなり簡単に畳み込みを行うことができます。

大きな$ n $の場合は可能です。中心極限定理を利用します。 $ 1- \ frac {1} {n} \ sum_ {i = 1} ^ n | A_i-B_i | $の平均と分散は単純です。エラーがなければ、$ \ frac {2です。 } {3} $および$ \ frac {1} {18n} $。

$ n = 8 $の場合はそれほど正確ではありませんが、$ n = 20 $の場合、正規近似はかなり良好です。

enter image description here

= ==

編集:

畳み込みを数値的に行うことができると言うとき、正確にはどういう意味ですか?正確には何を畳み込みますか?

$ Y_i = | A_i-B_i | $とすると、$ H = 1- \ frac {1} {n} \ sum_ {i = 1} ^ n Y_i $となります。

簡単な線形再スケーリングとは別に、$ Y_i $の合計の分布が必要です。

ここで畳み込みが発生します。 $ W + Z $の密度は、 PDFの畳み込みです。

もちろん、実際には、畳み込み積分は行いません。通常の統計的アプローチは、MGFまたはより一般的には特性関数を使用することですが、符号の問題(ここでも些細なこと)を除けば、CFは単なるフーリエ変換です(MGFが本質的にラプラス変換であるのと基本的に同じ意味です)。

したがって、数値的には、FFTを使用して畳み込みを処理できます。実際、次のように進行します(特性関数には記号を使用しますが、フーリエ変換は自由に考えることができます):

$ \ phi(Y_1 + Y_2 + ... + Y_n)= \ phi(Y_1)\ times \ phi(Y_2)\ times ... \ times \ phi(Y_n)$

$ \ hspace {2cm} = \ phi(Y_1)^ n $

次に、逆変換によって変換し直します。

数値を操作するプログラムでは、通常のアプローチは、pdfを適切に離散化することです(ある程度大きなパワーに) -of-2個;場合によっては$ 2 ^ {8} $から$ 2 ^ {10} $で十分な場合もあれば、$ 2 ^ {16} $以上が必要な場合もあります)、FFTを取得し、 n乗、元に戻します。定数を正しく処理する場合(とにかく逆FFTによって自動的に処理されるはずですが、最後に$ n $ iid確率変数の合計のpdfへの離散近似が得られます。

実際にはこのような操作は、最初から正しく行うのが少し面倒かもしれませんが、実行が非常に高速になる傾向があります。

===

1: Pham-Gia、T。and Turkkan、N。(1994)。ベータコンポーネントの寿命を持つスタンバイシステムの信頼性。信頼性に関するIEEEトランザクション、71–75。

私たちは同じ波長にいます:)
ああ、ちょっと、私はそこであなたの答えにさえ気づかなかった。非常に素晴らしい。はい、私たちが同じ方針で考えているように見えます。
あなたが最初でした:)(入力中にパスが交差しました)
ご回答ありがとうございます。残念ながら、正確な象徴的な解決策はありません。畳み込みを数値的に行うことができると言うとき、正確にはどういう意味ですか?正確には何を畳み込みますか?
答えの編集を見る
大変感謝いたします。最後の質問:n = 2の場合のpdfは既知であるとおっしゃいました。そのpdfの方程式は何ですか?それについてもっと研究するために私が調べることができる名前がありますか?
実際、私はそれが複雑だと言ったとしても(一般に2つのベータrvの場合はそうです)、この*特定の*ベータの場合、それは素晴らしくシンプルです-間違いなく手で行うのに十分簡単です。答えを修正します。
それについて考えると、実際には、この単純なケースでより大きな$ n $を実行することは可能であるはずですが、私はそれを試すことを提案しません(2よりも大きな$ n $の場合、正確な代数的答えを生成するために、通常の近似が実行可能なところまで数値積分を使用します)。
wolfies
2014-10-22 16:46:07 UTC
view on stackexchange narkive permalink

$ A $ span>と $ B $ span>が標準のUniformで独立している場合、 $(AB)\ sim Triangular(-1,0,1)$ span>。

次に、 $ Z = | AB | $ span>にはpdf $ f(z)$ スパン>:

  f = 2(1-z); domain [f] = {z、0、1};  

次に、 $ Z $のサンプル平均の特性関数(cf) span>は $ \ big(E \ big [e ^ {\ large i \ frac {t} {n} z} \ big] \ big)^ n $ スパン>:


(出典: tri.org.au) sub>

Mathematica mathStatica パッケージの Expect 関数を使用して、ワーリーカーリーを自動化しています。

(i)Zのサンプル平均の正確なpdf

cfはシンボリック反転の扱いやすい形式ではないようですが、できます em> $ n $ span>の任意の値を指定して数値的に反転し、 $ Zのサンプル平均のpdfを生成します。 $ span>。これは、以下のプロットで行われます(青い曲線を参照)。

(ii)Zのサンプル平均のCLT近似

pdfの上で導出しました $ Z $ span>、つまり $ f(z)$ span>の場合、 $ Z $ span>の平均は $ E [Z] = \ frac13 $ span>で、分散は $ Var(Z )= \ frac {1} {18} $ span>。

次に、中心極限定理により、 $ Z $ span>のサンプル平均は漸近的に正常です:

$$ \ bar Z_n \ overset {a} {\ sim} N \ big(E [Z]、\ frac {Var(Z)} {n} \ big)= N \ big(\ frac13、\ frac {1} {18 n} \ big)$$ span>

実際と概算を比較

$ n $ span>の任意の値について、簡単な漸近正規近似を正確なpdfと比較できるようになりました。次の図は、次のことを示しています。

  • $ n = 10 $ span>の場合の正確な解(cfを反転して導出):BLUE CURVE
  • 正規近似(CLT)、 $ n = 10 $ span>の場合:赤い曲線


(出典: tri.org.au) sub>

かなり小さい $ n = 10 $ span>、通常の近似はかなりうまく機能します。

残っているのは、 $ \ bar Z_n $からの簡単な変換だけです。 span>から $ 1- \ bar Z_n $ span>に、通常の平均を $ \ frac13 $ spanから変更するだけです。 >から $ \ frac23 $ span>まで、すべて完了です。

ご回答ありがとうございます。pdfを数値的に決定するためにどのプログラムを使用しましたか?これがMATLABで可能かどうか知っていますか?
_Mathematica_を使ってcfを数値的に反転し、pdfを取得しました。これは数値積分によって行われます。それがどのように行われるかを確認するには、Rose / Smith(2002)の第2章のセクション2.4Dを参照してください...無料でダウンロードできます:http://www.mathstatica.com/book/bookcontents.html私はMATLABで同じ手法を使用できることを確認してください。


このQ&Aは英語から自動的に翻訳されました。オリジナルのコンテンツはstackexchangeで入手できます。これは、配布されているcc by-sa 3.0ライセンスに感謝します。
Loading...