質問:
バークソンの堕落を証明する方法は?
WCB
2015-07-10 00:48:01 UTC
view on stackexchange narkive permalink

これは Berkson's Fallacyに基づく質問です。次の不等式は本当ですか?もしそうなら、どのように証明するのですか?

$ P(A | A \ cup B)\ geq P(A)$

不等式には数量詞が必要です。*すべての* $ A $と$ B $を意味しますか、それとも*存在する可能性があります* $ A $と$ B $ですか?また、$ A \ cup B $がスペース全体である場合は常に、$ P(A | A \ cup B)= P(A)$が厳密な不等式に違反するため、もう少し正確に記述する必要があります。
編集されたバージョン(大なり記号付き)では、すべての$ A $と$ B $に当てはまるはずですよね?それが「パラドックス」の本質ではないでしょうか。
三 答え:
dsaxton
2015-07-10 01:05:52 UTC
view on stackexchange narkive permalink

$$ \ begin {align} P(A \ mid A \ cup B)& = \ frac {P(A)} {P(A \ cup B)} \\ & \ geq P(A)。\ end {align} $$

+1。$ P(A \ cup B)= 0 $である可能性があるため、$$ P(A)= P(A | A \ cup B)P(A \ cup B)\ leの形式で再キャストすることで厳密にすることができます。P(A | A \ cup B)(1)= P(A | A \ cup B)。$$最初の等式は確率の公理と見なされることが多く、2番目の等式は$などの確率がないという公理から得られます。P(A \ cup B)$、$ 1 $を超えることができます。
AdamO
2015-07-10 01:02:02 UTC
view on stackexchange narkive permalink

私は主にバークソンのパラドックスとしてそれを聞いたことがあります。これは、曝露と結果を比較し、曝露または結果のいずれかを持つ個人のみをサンプリングする場合の、偽の関連の生成を指します。人口レベルの関連付けが次のようになっているとします。

$$ \ begin {array} {c | ccc} & D & \ bar {D} & \\ \ hline E & n_ {11} & n_ {12} & n_ {1。} \\\ bar {E} & n_ {21} & n_ {22} & n_ {2。} \\ & n _ {。1} & n _ {。2} & \\\ end {array } $$

次に、疾患の相対リスクは次の式で与えられます。

$$ RR = \ frac {n_ {11} / n_ {1。}} {n_ {21} / n_ {2。}} $$

ただし、サンプルでは次のようになります。

$$ \ begin {array} {c | ccc} & D & \ bar {D} & \\ \ hlineE & n_ {11} & n_ {12} & n_ {1。} \\\ bar {E} & n_ {21} & 0 & n_ {2。}-n {22} \ & n _ {。1} & n _ {。2} -n {22} & \\\ end {array} $$

セル数とマージンは、WLOGの上の「人口」に比例します。

推定相対リスクは次のようになります。

$$ RR_ {Berkson} = \ frac {n_ {11} / n_ {1。}} {n_ {21} /(n_{2。}-n_{22})} $$

$ n_ {22} = 0 $の場合を除いてバイアスがかかります。

生物統計学的ではない方法で、$ P(A \ cup B)\ neq 1 $、次に$ P( A | A \ cup B)= \ frac {P(A \ cap A \ cup B)} {P(A \ cup B)} = \ frac {P(A)} {P(A \ cup B)} $そして'仮定によって行われます。

質問のあなたの解釈とそれに対するあなたの答えは何ですか?「はい」または「いいえ」のどちらかである必要があるように見えますが、この回答には明確なものは何もありません。
Matt Krause
2015-07-10 07:44:11 UTC
view on stackexchange narkive permalink

はい、確かに$ P(A | A \ cup B)\ ge P(A)$です。

これは、2つのことを考えるのに役立ちます。分数としての量。次に、これら2つの事実からすべてがわかります。

  • 両方の確率の分子は、母集団に存在する$ A $の数で構成されます。これは、無条件確率$ P(A)$の場合は簡単であり、条件付き確率$ P(A | A \ cup B)$で条件の両側に$ A $が表示されることで保証されます。言い換えると、構造上、条件付きの「制限」は$ A $ sを破棄できません。

  • $ P(A)$の分母は次の合計です。母集団内の$ A $ sの数、それに含まれる$ B $ sの数、さらに$ C $ s、$ D $ sの数、およびその他の数。ただし、$ P(A | A \ cup B)$の分母は、単に$ A $ sの数に$ B $ sの数を加えたものです。条件は他のすべてを除外します。これらはすべて非負の数であるため、$ P(A)$の分母は、少なくとも$ P(A | A \ cup B)$の分母と同じ大きさである必要があります。

したがって、$$ \ begin {align} P(A)& = \ frac {|| A ||} {|| A || + || \ textrm {その他すべて} ||} \\ P(A | A \ cup B)& = \ frac {|| A ||} {|| A || + || B || -|| A \ cap B ||} \ end {align} $$

分子は同じですが、$ P(A)$の分母が$ P(以上)であるためA | A \ cup B)$の場合、$ P(A | A \ cup B)\ ge P(A)である必要があります。 \ blacksquare $

$ A $と$ B $が無関係であるか、相互に排他的である場合でも当てはまるため、人々はこれをパラドックスと呼んでいます。 $ P(A)$が、$ A $がプロバスケットボールをプレーする確率であり、$ B $が、$ B $がバスケットボールでひどいことを示しているとします。条件がバスケットボールで公平に中途半端な(そしてニックスのためにたまたまプレーしない)人々を除外するので、不平等はまだ保持されます、それで分母はまだ全体の人口より小さいです。

より一般的には、条件付き確率の分母は常に無条件確率の分母以下になることは事実です。

$ P(A \ cup B)= P(A)+ P(B)-P(A \ cap B)$であることを忘れないでください。$ A $と$ B $は相互に排他的ではない場合があります。
@dsaxton,はtrueですが、条件の分母をさらに縮小するだけです...
2番目の箇条書きの最後の文にタイプミスがありますか?黒い四角の前の最後の文と矛盾しますか?


このQ&Aは英語から自動的に翻訳されました。オリジナルのコンテンツはstackexchangeで入手できます。これは、配布されているcc by-sa 3.0ライセンスに感謝します。
Loading...