複数のt検定のp値補正？

no_name

2014-12-13 01:25:37 UTC

view on stackexchange narkive permalink

私のデータセットは$ n $の遺伝子で構成されており、それぞれが発現値のベクトルで記述されています。「健康な」個人の場合は$ 5 $、「不健康な」個人の場合は$ 5 $です。

$ n $ t検定（遺伝子ごとに1つ）を実行して、健康な集団と不健康な集団の間で異なる動作を示す遺伝子を特定します。

修正を検討する必要があります（Bonferroni、Holm、Benjamini &など）。 Hochberg ...）$ n $ p値の場合？

編集：

私のケースが多重比較問題であるかどうか疑問に思っています。

実際、私は遺伝子を比較しませんが、各遺伝子の2つの異なる母集団（健康なものと不健康なもの）の値のみを比較します。したがって、多重比較は見られません。

つまり、健康なサンプルと不健康なサンプルの間で異なる動作をする遺伝子を見つけることに興味があります。 2つの遺伝子が同じように動作するかどうかを調べることに興味はありません。

明らかに、$ n $ t検定を実行すると、補正を計算した後よりもはるかに多くのp値が$ 0.05 $より低くなります。

ようこそ！[誤検出率の制御]（https://en.wikipedia.org/wiki/False_discovery_rate）または[ファミリーワイズエラー率]の制御に関するウィキペディアの記事を読んだときに、あなたの既存の理解と混乱する場所は何ですか。（https://en.wikipedia.org/wiki/Familywise_error_rate）？* how *（ありがたいことに、howは非常に簡単で、ソフトウェアに実装されることが多い）、* when *（$ n $の比較で正しい方向に進んでいるように見える）、または* why *ですか？または、他の何か？左下の「編集」リンクをクリックすると、これらの線に沿って質問を明確にすることができます。

ある種の修正を適用するかどうか、およびそれらを適用する計算の種類は、推論にどのようなプロパティを持たせるかによって異なります。状況によっては、タイプIのエラー率（または、それ以上気にする場合は誤検出率）が、必要なプロパティを既に持っているように選択されている場合、修正を気にしない場合があります。たとえば、「私が選択した$ \ alpha $は、実際には、比較ごとに使用できるタイプIのエラー率です。なぜ調整する必要があるのでしょうか？」と言うかもしれません。（テスト間の依存が可能であることに注意してください）

@no_name:も参照してくださいhttp://stats.stackexchange.com/questions/164181/family-wise-error-boundary-does-re-using-data-sets-on-different-studies-of-inde/164232#164232