4つのサンプルペアがあります。たとえば、(x1、y1)、...、(x4、y4)とします。
- 対応のあるt検定の最小サンプルサイズはいくつですか?
- 対応のあるt検定を確認する必要があるのはどの仮定ですか?
- データが正規でない場合、代替のノンパラメトリック検定とは何ですか?
4つのサンプルペアがあります。たとえば、(x1、y1)、...、(x4、y4)とします。
サンプルサイズがこのように小さい場合、正規性の仮定はかなり重要です。この仮定に誤りがあると思われる場合は、ウィルコクソンの符号付き順位検定を検討してください。
母集団が正規分布している場合、最小サンプルサイズはありません。母分散に比べて平均差が小さい場合は、パワーもほとんどありません。ただし、サンプルサイズが非常に小さい場合でも、良好な検出力を得ることができます。
例として、ペアごとの差が(未知の)分散$ \ sigma ^ {2} = 1 $で正規分布していると仮定します。以下は、平均ペアワイズ差の$ 0、.5、1、...、5 $の増分値のパワーのモンテカルロ推定(10000シムを使用)です
平均差パワー[1 、] 0.0 0.0512 [2、] 0.5 0.1097 [3、] 1.0 0.2934 [4、] 1.5 0.5250 [5、] 2.0 0.7467 [6、] 2.5 0.8975 [7、] 3.0 0.9648 [8、] 3.5 0.9925 [9、] 4.0 0.9976 [10、] 4.5 0.9998 [11、] 5.0 0.9999
したがって、平均差の場合でも、対応のある$ t $検定で十分な検出力が得られる可能性があることがわかります。 $ n = 4 $であっても、差の分散と比較してかなり大きい(この場合は少なくとも2倍)。差異が正規分布していない場合、これはすべてウィンドウの外に直接出てしまうことに注意してください。
以下のRコードを使用したい場合は、平均差と分散の他の値についてこれらの累乗を確認できます(注:$ n = 4 $を使用した場合の$ t $検定の臨界値通常の.05カットオフは3.182446です。テストされるヌル値は0と見なされます)。
U = seq(0,5、by = .5)V = U-Usig = 1for(k in 1:11){Z = rep(0,10000)for(i in 1:10000){diffs = rnorm(4、mean = U [k]、sd = sig)z =(mean(diffs)-0)/(sd(diffs)/ sqrt(4))Z [i] = z } V [k] = mean(abs(Z)>3.182446)} X = cbind(U、V)colnames(X)= c( "Mean Difference"、 "Power")X
t検定の最小サンプルサイズはありません。しかし、@ shabbychefが指摘したように、あなたにはほとんど力がありません。
対応のあるt検定の最小サンプルサイズはいくつですか?
一般的に、通常の対応のあるt検定の場合、2つのペアは次のようになります。最小で、1dfを生成します
対応のあるt検定を確認する必要があるのはどの仮定ですか?
通常、すべてを評価しようとしますが、4つしかない場合ペア、試してみるのはほぼ絶望的です。 4つのペアの違いがあり、そのうち2つのd.f.差の平均と分散(仮定に関係のない場所とスケール)の推定に行き、本質的に2つのd.fを残します。変化する分散、依存性(存在する場合は、どのような形式で検索するか)、および正規性を評価します。
データが非正規である場合、代替のノンパラメトリック検定は何ですか?
ペアデータ:ウィルコクソンの符号付き順位検定。または符号検定;または、任意の数の種類の並べ替え検定またはブートストラップ検定(統計の作成方法/正確に検定する内容によって異なります)。もちろん、それらすべてにはまだ仮定があります。
しかし、t検定は、少なくとも軽度の差異の非正規性(および正常であると思われる差異)に対して少なくとも適度にロバストです。観測値が、やや右スキューで裾があまり大きくない場合、サンプルサイズが大きい場合でも、違いは通常と見分けがつかない可能性があります。とはいえ、非正規性が主な懸念事項である場合、符号付き順位検定を回避する理由はほとんどありませんが、4ペアの場合、有意水準12.5%でほとんど行き詰まります
。