質問:
独立して同一に分布する確率変数とはどういう意味ですか?
Jahid Nur
2016-12-30 23:15:08 UTC
view on stackexchange narkive permalink

コイントスは、いくつかのWebサイトでIIDと呼ばれています。概念を正しく理解している場合に知りたいこと。

Xが「コイントスの結果」を意味する確率変数を表す場合、$ x_1、x_2、...、x_n $コイントスを繰り返した結果です。$ x_1、x_2、...、x_n $ IIDですか?はいの場合、観測値を変数にするにはどうすればよいですか?

または、$ X_1、X_2、...、X_n $は、それらをIIDと見なしたい場合、すべて確率変数と見なされますか?ランダムサンプルをIIDにするにはどうすればよいですか?

「観測」は、収集されたデータの単位で構成されます。「確率変数」は、データについて推論するために使用される理論的構成概念である。これらの問題については、当サイトで「確率変数」や「独立」などの関連キーワードを検索してみてください。
ビル・フーバーが言ったことを繰り返します。あなたの場合、各Xiはパラメーターp = 1/2のベルヌーイ確率変数であり、変数X1からXnのコレクションは統計的に独立しており(正式な定義を調べてください)、それぞれが同じベルヌーイ分布を持っています。また、これらのn個のベルヌーイ変数の合計として定義される確率分散は、Bin(n、1/2)で表される二項分布を持つ確率変数です。
編集は上記のコメントの有効性を変更しません。xは観測値を表し、Xは確率変数を表すことに注意してください。これらは2つの別々のものです。
IIDのことを説明してください。私はとても混乱しています。
同じように分布することの意味とテイラーが独立を定義したことをお話ししました。ビル・フーバーと私はどちらも、自分でそれについて読むべきだと思います。
各$ X_i $がベルヌーイ確率変数であることを理解しました。しかし、それらは$ X $の値/結果を表していないのでしょうか?X1からXnがIIDの場合、Xについてどう思いますか?
質問を重複としてマークするという決定に同意します。クローズするアクションはおそらくもっと早く行われるべきでした。ビル・フーバーは彼の最初の発言に親切すぎました、
二 答え:
Taylor
2016-12-30 23:32:38 UTC
view on stackexchange narkive permalink

「IID」は独立および同一分布の略です。 IIDサンプルは、「ランダムサンプル」とも呼ばれます。これは、すべての確率変数の分布を参照しています:$ X_1、\ ldots、X_n $。あなたの場合、結合質量関数$ f_ {X_1、\ ldots、X_n}(x_1、\ ldots、x_n)$を探しています。

通常、確率変数はまだ観測されていないデータと考えることができ、$ X_1 $のように、アルファベットの終わりに大文字で示されます。コインを裏返して$ 0 $または$ 1 $を観察した後(「頭」と「尾」、または$ -1 $と$ 1 $ではなく、この方法で結果をコーディングします)、または確率変数について仮想的に話し合った後特定の値であるため、そのエンティティはランダムではなくなります。これは固定番号であり、通常は$ x_1 $のように小文字で表されます。それらを「変数」と呼ぶことはできますが、「確率変数」と呼ぶことはできません。

上記の表記を見て、$ n $の数値、$ x_1、\ ldots、x_n $のセットを関数にプラグインすると$ f_ {X_1、\ ldots、X_n}(x_1、\ ldots、x_n)$、コインフリップのこの離散構成の確率を取得します。

一般に、$ n $確率変数$ X_1、\ ldots、X_n $の同時分布を考え出すことは困難です。ほとんどの人は、単変量分布(正規、ガンマ、指数、カイ2乗、F、tなど)に精通しています。あなたの場合、各$ X_i $にはベルヌーイ分布があることがわかっています。言い換えると、$$ f_ {X_i}(x_i)= p ^ {x_i}(1-p)^ {1-x_i}、$$ここで、$ 0 < p < 1 $は各確率変数のパラメーターです。

  1. 独立とは、確率変数ごとに1つずつ、ジョイントが$ n $個の周辺分布に「分割」または因数分解されることを意味します。言い換えると、
  2. ol>

    $$ f_ {X_1、\ ldots、X_n}(x_1、\ ldots、x_n)= f_ {X_1}(x_1)\ times \ cdots \ times f_ {X_n}(x_n)。$$

    1. 同一は、それらがすべて同一の確率質量関数であることを意味します。または、あなたの場合、各コイントス確率変数は同じパラメーター$ p $を共​​有します。
    2. ol>

      $$ f_ {X_1}(x_1)\ times \ cdots \ times f_ {X_n}(x_n)= [p ^ {x_1}(1-p)^ {1-x_1}] \ times\ cdots \ times [p ^ {x_n}(1-p)^ {1-x_n}]。$$

      これら2つの仮定をまとめると、同時分布/確率質量関数は

      $$ f_ {X_1、\ ldots、X_n}(x_1、\ ldots、x_n)になります。= p ^ {\ sum_i x_i}(1-p)^ {n- \ sum_ix_i}。$$

これは素晴らしいことですが、OPは確率と統計に慣れていないようで、実際には観測値と確率変数の違いを理解するだけでよい場合があります。
@MichaelChernickああ、あなたは間違いなく正しいです。いくつか編集します。
実際、私はテイラーが説明したすべてを理解しました。御時間ありがとうございます
giusti
2016-12-31 01:20:13 UTC
view on stackexchange narkive permalink

:OPの問題は、「iid」が実際に意味するものよりも、確率論と確率変数の背後にある概念を混乱させることに関係していると思います。そこで、非公式な説明をしようと思います。 。iidの計算では、@ Taylorの応答は非常に適切です。)

確率変数は、コイン、ダイス、またはその他の「ランダムオブジェクト」ではなく、非決定的な問題を表すために使用する抽象化です。したがって、1つのコイントスが$ X $、2つのコイントスが$ X_1 $と$ X_2 $などであるという厳密な規則はありません。

コインを1つの変数$ Xとしてモデル化することの興味深い点$は、すべてのコインの抽象化、またはコイントスのすべての可能な実現を作成することです。コインが公正である限り、コインを投げるときはいつでも、ベルヌーイ分布に従う変数$ X $を考えることができます。

コイントスの連続を研究している場合は、思い付く可能性があります。それをモデル化する最も工夫された方法で。たとえば、一連の$ n $コイントスのすべての可能な結果を​​表す確率変数$ Y $を考えることができます。または、最初の3回のトスの組み合わせ結果に対する確率変数$ Y_3 $や、残りのトスの組み合わせ結果に対する別の確率変数$ Y_r $など、さらに奇妙なことを行うこともできます。

しかし、それはばかげているでしょう。どうして?コインを$ n $回投げることには、2つの興味深いことがあるためです。

  1. 各投げは他の投げには影響しません(独立)。
  2. すべての投げは同じです。各トスで頭が上がる確率は常に0.5です(同じ分布)。
  3. ol>

    つまり、3番目の質問に答えるには:

    または$ X_1 $です。 、$ X_2 $、...、$ X_n $は、それらをIIDと見なしたい場合、すべて確率変数と見なされますか?

    確率変数を「考慮」しません。現実の世界には$ X_1 $、$ X_2 $、...、$ X_n $のようなものはなく、$ X_1 $、$ X_2 $、...、$ X_n $を考えなければならないということは何もありません。 $ n $コイントスについて考えてみてください。

    ただし、これらの$ n $変数とその確率分布を考えると、それらはすべてi.i.dであると言えます。上記のプロパティ1と2のため。そして確率論では、i.i.dのコレクションがあるときに他の人があなたが使用できることを発見したあらゆる種類の有用な数学があります。変数。

    明確にするために、これらの変数は独立したイベントを表すため、独立しています(各$ X_i $は異なる独立したトスに関連しています)。そして、それらはすべて同じ分布に従うため、同じように分布します。$ p = 0.5 $のベルヌーイ確率分布です。

    では、$ X $はどうなりましたか?何もありません。コインを$ n $回投げるのは、コインを1回投げるのとは別の問題であるため、これらの確率変数$ X_1 $、$ X_2 $、...、$ X_n $を発明したことに注意してください。 $ X $の興味深い点は、各変数$ X_i $が、元の変数$ X $と個別に同じプロパティを持っていることです。

    残りの質問に戻りましょう:

    $ X $が「コイントスの結果」を意味する確率変数を表す場合、$ x_1 $、$ x_2 $、...、$ x_n $はコイントスを繰り返した結果です。 $ x_1 $、$ x_2 $、...、$ x_n $ IIDですか?はいの場合、観測値はどのように変数になりますか? [...]
    ランダムサンプルをIIDにするにはどうすればよいですか?

    概念はすべて非常に密接に関連しているため、確率論の用語は複雑になることがあります。しかし、これが私が知っていることです。

    厳密に言えば、正しいのは、$ x_1 $、$ x_2 $、...、$ x_n $が描画される strongということです。 > iidのコレクションから変数$ X_1 $、$ X_2 $、...、$ X_n $。

    ただし、観察はコインが投げられた後にのみ存在します(したがって、それはもはやランダムではありません)が、私たちはまだ一般的な言葉で話しています。コインを何度も投げたために知っている特定の一連の観測ではなく、$ n $の観測が行われる可能性のある あらゆる状況について話します。だから私たちはそれらを知りません。それらを確率変数として扱うこともできます。

    したがって、観測値は確率変数ではありませんが、実際には確率変数に属する多くのプロパティをそれらに関連付けることは理にかなっています。したがって、拡張により、$ x_1 $、$ x_2 $、...、$ x_n $はi.i.dであると言えます。それらはすべて独立して、同一の分布から描かれたためです。

これらの長いチュートリアルタイプの回答を与えることは、OPにうまく役立たず、確かにコミュニティにも役立ちません。OPを他の読み物に紹介することで、whuberとXi'anが行ったことを行う方が理にかなっていると思います。
「チュートリアルタイプの回答」とはどういう意味かわかりません。またはそれの何が問題になっていますか。
これが私が探していたタイプの答えです。私があなたの答えのどの部分も理解していないと感じたら、私を助けてくれるように頼むことができますか?
お役に立てて嬉しいです!コメントで答えられる質問があれば、ここに残してください。私が答えようとします。または、いつでも新しい質問を投稿できます。1-1の会話を長く続けるには、私はそれほど周りにいません。
これは良い答えであり、多くの直感を与えると思います。


このQ&Aは英語から自動的に翻訳されました。オリジナルのコンテンツはstackexchangeで入手できます。これは、配布されているcc by-sa 3.0ライセンスに感謝します。
Loading...