質問:
p1 = p2 = p3 = p4という帰無仮説を棄却または棄却しないにはどうすればよいですか?
Steve Stewart
2012-09-21 07:11:33 UTC
view on stackexchange narkive permalink

コンピューター化されたテストの質問に対して信頼性分析を行う必要があります。多肢選択式の質問がある場合、最初にテストが行​​われたときに20/25が正しかった場合、2回目にテストが行​​われたときに22 / 30、3回目にテストが行​​われたときに15 / 22、4回目に14/23が正解でした。テストが行​​われたので、これらすべてが同じ母集団からのものであるかどうかを判断したいと思います。 [母集団は同じだと思いますが、質問は信頼できますか?]帰無仮説を棄却できない場合、技術的には証明されていませんが、仮定は信頼性です。

これにANOVAをプロポーションに使用することを考えていますが、これを行うために必要な仮定が満たされているかどうかはわかりません。私のサンプルサイズは小さいです。何がお勧めですか?

これに対する最も一般的なアプローチ(他にもたくさんあります!)は、均質性のカイ2乗検定として知られています-2つのサンプル比率検定を一般化します。これは、いくつかの点でANOVAに似ています。 (カイ2乗を直交対比に分割したり、すべてのペアワイズ比較の事後検定を実行したりすることもできますが、ソフトウェアでこれらをすぐに利用できない場合があります。ただし、「手動で」計算するのは難しくありません)
二 答え:
Zen
2012-09-21 09:22:00 UTC
view on stackexchange narkive permalink

$ C = 2 $列と$ R = 4 $行の分割表があります。

 正しい間違った1st20 5 252nd 22 8 303rd 15 7 224th 14 9 23 71 29100  

$ N_ {ij} $を$(i、j)$セル内の観測数とします。定義$$ N_ {i +} = \ sum_ {j = 1} ^ C N_ {ij} \ qquad \ textrm {and} \ qquad N _ {+ j} = \ sum_ {i = 1} ^ R N_ {ij} $ $ for $ i = 1、\ does、R $および$ j = 1、\ dots、C $。また、$ N _ {++} = \ sum_ {i = 1} ^ R \ sum_ {j = 1} ^ C N_ {ij} = 100 $を定義します。

$ p_ {ij} $とします。セルの確率になります。帰無仮説は$$ H_0:p_ {11} = p_ {21} = p_ {31} = p_ {41} \、。$$

$ \ hat {E} _ {ij}の定義= N_ {i +} N _ {+ j} / N _ {++} $の場合、$ H_0 $の下で統計量$$ Q = \ sum_ {i = 1} ^ R \ sum_ {j = 1} ^ C { (N_ {ij}-\ hat {E} _ {ij})^ 2 \ over \ hat {E} _ {ij}}、$$は$(R-1)でおよそ$ \ chi ^ 2 $分布を持っています(C-1)= 3 $自由度。

したがって、純粋な有意性検定は、$ Q>a $の場合、$ H_0 $を棄却することです。ここで、$ a $は、選択した一部の$ P \ {Q>a \ mid H_0 \} = \ alpha_0 $のようになります。有意水準$ \ alpha_0 $。

これは均質性の$ \ chi ^ 2 $検定と呼ばれます。

たとえば、$ \ alpha_0 = 0.05 $の場合、あなたの場合$ a $は約$ 7.81 $です。

  >qchisq(.95、df = 3)[1] 7.814728  

編集

これらのデータの場合、カイ2乗統計量は$ 2.294 $であり、$ \ alpha = 0.05 $の臨界値よりはるかに小さくなります。より正確には、その「p値」は$ 0.5137 $です。つまり、$ 2.294 $は、3自由度のカイ2乗分布の$ 51.37 ^ \ text {th} $パーセンタイルです。これは、これらのデータが帰無仮説の下で予想されるのとほぼ同じくらい(または少しだけ)変化することを示しています。

これらの計算は、スプレッドシートまたは電卓を使用して(カイ2乗とともに)実行できます。表)が、もっと簡単な方法があります。 x が上記のデータ行列であるとすると、 R

  > chisq.test(x)ピアソンのカイ2乗検定データを与えます:x
X-squared = 2.2941、df = 3、p-value = 0.5137  

小さな分割表の分析には、別のテストフィッシャーの直接確率検定が推奨される場合があります。必ずしも良いとは限りません。類似しているが微妙に異なる帰無仮説をテストします(詳細については、リファレンスを参照してください)。それでも、そのp値をカイ2乗p値と比較することにより、カイ2乗近似が正確であるかどうかを大まかに確認できます。大きな違いは赤旗になります。これらのデータには、近似が正確ではない(すべてのセルの値が$ 5 $以上)と疑う理由はありませんが、確認しましょう。

  > fisher.test(x)フィッシャーの直接確率検定カウントデータデータの正確確率検定:x p値= 0.5126対立仮説:両側 

数値$ 0.5126 $と$ 0.5137 $は非常に近いため、両方の検定で信頼できるpが得られます。 -値:これらのデータに信頼性がないという証拠はありません。

+1非常に良い@Zen。これは、私が非常に簡単な答えで得ていた考えを詳細に説明しています。均質性と代替案のカイ二乗検定が、OPが問題を解決するために必要なものであることに同意します。あなたの答えは、OPに役立つはずのこれに関するちょっとしたチュートリアルです。あなたの例の表は、OPが彼のデータとカイ二乗検定を構成し、Willの臨界値がOPの質問に答えるのに非常にうまく機能することを私が提案した方法です。彼は本当に彼の答えを得るために彼の検定統計量をこの臨界値と比較する必要があります。
p値を追加することも役立つと思います。限界合計が小さく、カイ二乗近似が良くないのではないかと少し心配したので、最初に正確な検定を使用することを考えました。しかし、あなたの答えに表示された表を見ると、すべてのセルが5以上であり、各セルの帰無仮説の下で予想される頻度についても同じことがおそらく当てはまることがわかります。
Zen、$ Q $の定義で「\ frac」を表示するのにまだ問題がありますか? (私には問題ないように見えます。)
@Zenフィッシャーの正確確率検定の説明をうまく追加する編集を考えると、あなたの答えは間違いなくチェックマークに値すると思います。おそらく、周辺合計に対するフィッシャーの直接確率検定条件を追加し、帰無仮説の下で同じ周辺合計を持つテーブルの順列に関連付けられている超幾何分布を調べることができます。
@Zenこの例のカイ二乗検定の信頼性に関する全体的な結論に確かに同意します。私はあなたがしたことをしたでしょう。
私は編集をしませんでした、マイケル:それは唯一のビルハバーでした。分析をうまく完了してくれてありがとうビル!繰り返しますが、それはチームワークです。
ビル:\ fracの問題については、分数の後にコンマを追加します。それがどれほど奇妙に見えるか見てください。
whuberにも感謝します。答えの後半は彼によって書かれました。
Michael R. Chernick
2012-09-21 08:11:39 UTC
view on stackexchange narkive permalink

この場合、ANOVAは適切ではありません。これを2x4の分割表と考えてください。フィッシャーの直接確率検定をRxCテーブルに一般化することで、まさにあなたが望むことを実行できると思います。 Zenは、Rのプログラムを使用したフィッシャーの直接確率検定の詳細な計算を提供しています(Rにあると思います)。彼が提案したカイ二乗近似検定は、アプリケーションで正常に機能します。



このQ&Aは英語から自動的に翻訳されました。オリジナルのコンテンツはstackexchangeで入手できます。これは、配布されているcc by-sa 3.0ライセンスに感謝します。
Loading...