質問:
対応のあるt検定の最小サンプルサイズと、データが非正規である場合のノンパラメトリック同等物とは何ですか?
love-stats
2011-08-17 04:44:50 UTC
view on stackexchange narkive permalink

4つのサンプルペアがあります。たとえば、(x1、y1)、...、(x4、y4)とします。

  • 対応のあるt検定の最小サンプルサイズはいくつですか?
  • 対応のあるt検定を確認する必要があるのはどの仮定ですか?
  • データが正規でない場合、代替のノンパラメトリック検定とは何ですか?
効果量が大きくない限り(たとえば、$ x_i $が蝶の重さで、$ y_i $がそれを見つけた木の重さである場合)、4ペアしかない非常に小さな力になります。
素晴らしい例です!私は今私のコンサルティングでそれを使用します:-)
@shabby効果量は応答の*標準偏差*に依存するため、蝶や木がどのように良い例を提供するかはわかりません。
@whuber:良いキャッチ;重みの_logs_を比較すると、これが修正される可能性があると思います(変動と測定ノイズが幾何学的であると仮定)。
私はただ興味があります。最近の論文Jovanellyand Lane(2012)が、両方の手段でサンプルサイズ1の対応のあるT検定を実行しようとしたことに気付きました。これは悪い考えだという印象を受けました。誰かが私のためにこれを明確にすることができますか?
論文へのリンク、そしておそらく文脈の簡単な説明が良いでしょう。
@naught101 Curiousはこれを意味するのだろうか:http://benthamscience.com/open/togeoj/articles/V006/65TOGEOJ.htm
この質問:[t検定が有効になるために必要な最小サンプルサイズはありますか?](http://stats.stackexchange.com/questions/37993/)もこのスレッドの読者の興味を引く可能性があります。
三 答え:
Macro
2011-08-17 07:49:01 UTC
view on stackexchange narkive permalink

サンプルサイズがこのように小さい場合、正規性の仮定はかなり重要です。この仮定に誤りがあると思われる場合は、ウィルコクソンの符号付き順位検定を検討してください。

母集団が正規分布している場合、最小サンプルサイズはありません。母分散に比べて平均差が小さい場合は、パワーもほとんどありません。ただし、サンプルサイズが非常に小さい場合でも、良好な検出力を得ることができます。

例として、ペアごとの差が(未知の)分散$ \ sigma ^ {2} = 1 $で正規分布していると仮定します。以下は、平均ペアワイズ差の$ 0、.5、1、...、5 $の増分値のパワーのモンテカルロ推定(10000シムを使用)です

 平均差パワー[1 、] 0.0 0.0512 [2、] 0.5 0.1097 [3、] 1.0 0.2934 [4、] 1.5 0.5250 [5、] 2.0 0.7467 [6、] 2.5 0.8975 [7、] 3.0 0.9648 [8、] 3.5 0.9925 [9、] 4.0 0.9976 [10、] 4.5 0.9998 [11、] 5.0 0.9999  

したがって、平均差の場合でも、対応のある$ t $検定で十分な検出力が得られる可能性があることがわかります。 $ n = 4 $であっても、差の分散と比較してかなり大きい(この場合は少なくとも2倍)。差異が正規分布していない場合、これはすべてウィンドウの外に直接出てしまうことに注意してください。

以下のRコードを使用したい場合は、平均差と分散の他の値についてこれらの累乗を確認できます(注:$ n = 4 $を使用した場合の$ t $検定の臨界値通常の.05カットオフは3.182446です。テストされるヌル値は0と見なされます)。

  U = seq(0,5、by = .5)V = U-Usig = 1for(k in 1:11){Z = rep(0,10000)for(i in 1:10000){diffs = rnorm(4、mean = U [k]、sd = sig)z =(mean(diffs)-0)/(sd(diffs)/ sqrt(4))Z [i] = z } V [k] = mean(abs(Z)>3.182446)} X = cbind(U、V)colnames(X)= c( "Mean Difference"、 "Power")X  
Rでは、よりユーザーフレンドリーな `power.t.test`を使用して同じ結果を得ることができます。これにより、修正し続ける内容に柔軟性がもたらされます。例えば。上記の例は `for(k in 0:11){cat(sprintf("%f%f \ n "、k / 2、power.t.test(n = 4、delta = k / 2、sd = 1 、type = "paired")$ power))} `
ウィルコクソン検定ではより大きなサンプルサイズ `n> 20`が必要であるとどこかで読みました。コメントできますか?
Peter Flom
2011-08-17 05:18:56 UTC
view on stackexchange narkive permalink

t検定の最小サンプルサイズはありません。しかし、@ shabbychefが指摘したように、あなたにはほとんど力がありません。

力がほとんどないかもしれません。正規性の仮定が成り立つ場合、t検定は、1つとして、符号付き順位検定よりも強力です。これは、他のさまざまなノンパラメトリック検定にも当てはまると思います。したがって、t検定を使用するのが最善の場合もあります。
技術的には、標準偏差/エラーは1つのサンプルだけでは定義されないため、最小サンプルサイズは2ペアではないでしょうか。 Rの `t.test`は、1つのサンプルのみでテストを実行することを拒否します。
@macroは、t検定には通常の検出力の利点がありますが、データが実際に正常である確率はゼロになります。また、t検定が(驚くほど小さい)を失うのに、正規性からそれほど大きなシフトは必要ありません。仮定が正しい場合、サンプルサイズが小さい場合の検出力の利点。 「なぜ保険を買うのか、完璧に運転すればお金の無駄になる」と言っているようなものです。
@DavidJ.Harrisはい、もちろんです。
@Glen_b, ***「データが実際に正常である確率がゼロになる」***が何を意味するのかわかりません。すべての仮定がおそらく間違っていることについてのステートメントである場合は、文字通り任意の手順に穴を開けることができます(符号付き順位検定を含む-それでもランダムサンプルが必要です;))。 2点目は、正常からの逸脱の種類に大きく依存していると思います。正常性からの逸脱は、実際にテストの検出力を高める可能性があります。おそらく、具体的には、あなたが意味したことを拡張することができます。
たとえば、@macroは、かなり正常に見えるが、符号付き順位検定がtよりも優れたパワーを持つ前に、テールが少し重い分布で作業する必要があるだけです。なぜ通常の*で*部分的に優れたパワーが特に役立つのでしょうか?符号付き順位検定に対するtの効率は非常に低くなる可能性がありますが、tに対する最悪の場合でも、符号付き順位検定の効率の低下は悪くありません。
Glen_b
2012-10-18 07:07:51 UTC
view on stackexchange narkive permalink

対応のあるt検定の最小サンプルサイズはいくつですか?

一般的に、通常の対応のあるt検定の場合、2つのペアは次のようになります。最小で、1dfを生成します

対応のあるt検定を確認する必要があるのはどの仮定ですか?

通常、すべてを評価しようとしますが、4つしかない場合ペア、試してみるのはほぼ絶望的です。 4つのペアの違いがあり、そのうち2つのd.f.差の平均と分散(仮定に関係のない場所とスケール)の推定に行き、本質的に2つのd.fを残します。変化する分散、依存性(存在する場合は、どのような形式で検索するか)、および正規性を評価します。

データが非正規である場合、代替のノンパラメトリック検定は何ですか?

ペアデータ:ウィルコクソンの符号付き順位検定。または符号検定;または、任意の数の種類の並べ替え検定またはブートストラップ検定(統計の作成方法/正確に検定する内容によって異なります)。もちろん、それらすべてにはまだ仮定があります。

しかし、t検定は、少なくとも軽度の差異の非正規性(および正常であると思われる差異)に対して少なくとも適度にロバストです。観測値が、やや右スキューで裾があまり大きくない場合、サンプルサイズが大きい場合でも、違いは通常と見分けがつかない可能性があります。とはいえ、非正規性が主な懸念事項である場合、符号付き順位検定を回避する理由はほとんどありませんが、4ペアの場合、有意水準12.5%でほとんど行き詰まります



このQ&Aは英語から自動的に翻訳されました。オリジナルのコンテンツはstackexchangeで入手できます。これは、配布されているcc by-sa 3.0ライセンスに感謝します。
Loading...