サンプル$(x_i)\ sim _ {\ text {iid}} {\ cal N}(\ mu、\ sigma ^ 2)$に基づいて、正確な、または適切に近似された許容範囲の上限を取得するにはどうすればよいですか。 (つまり、分布の分位数の信頼限界の上限)$ \ dfrac {x_i} {\ sigma} $?ここでは、パラメータ$ \ mu $と$ \ sigma ^ 2 $の両方が不明であると想定しています。
サンプル$(x_i)\ sim _ {\ text {iid}} {\ cal N}(\ mu、\ sigma ^ 2)$に基づいて、正確な、または適切に近似された許容範囲の上限を取得するにはどうすればよいですか。 (つまり、分布の分位数の信頼限界の上限)$ \ dfrac {x_i} {\ sigma} $?ここでは、パラメータ$ \ mu $と$ \ sigma ^ 2 $の両方が不明であると想定しています。
くそー!バウンティを開始した後、答えは簡単であることに気付きました。分位数は$ \ frac {\ mu} {\ sigma} + z_p $の形式であり、「効果量」$ \ fracに関する信頼区間を取得するための既知の方法がいくつかあります。 {\ mu} {\ sigma} $(または、変動係数に関する信頼区間の境界を反転することにより、このような信頼区間は Rパッケージ MBESS
で利用できます。 。
S-Plusを使用した環境統計(CRC Press、2001)で、StevenMillardとNagarajNeerchalは、
$ \ beta $ span> -content 許容間隔と 信頼レベル $(1- \ alpha)100 $ span>%は、少なくとも $ \ beta 100 $ %( ie 、カバレッジは少なくとも $ \ beta 100 $ span>%)、確率 $(1- \ alpha)100 $ span>%。
いくつかの情報源を引用すると(Wald & Wolfowitz 1946、Guttman 1970、Gibbons 1994)、 $ n $ span>の観測値のおおよその両側許容間隔(サンプル平均)+ $ K $ span>(サンプル標準偏差)ここで
$$ K = r \ sqrt {\ frac {n-1} {\ chi ^ 2_ {n-1、\ alpha}}}。$$ span>
ここでは、 $ \ chi ^ 2_ {n-1、\ alpha} $ span>は、 $ \ alpha $ span>分位数です。 "math-container"> $ n-1 $ span>の自由度と
( $ \ Phi $ span>標準の通常のCDFを使用)。
Wald and Wolfowitz(1946)は、 $ n $ span>の値が
$ 2 $ span>、ただし $ \ beta $ span>と $ 1- \ alpha $ span>の両方が大きい場合 $ 0.95 $ span>より。さらに、Ellison(1964)は、この近似では、信頼レベルの誤差が $ 1 / n $ span>のオーダーであることを示しています。
Millard & Neerchalは、片側許容間隔のより単純なケースについても説明しています。ここで
$$ K = \ frac {t_ {n-1、z_ \ beta \ sqrt {n}、1- \ alpha}} {\ sqrt {n}}。 $$ span>
表記
httpのスプレッドシートで、これらの(通常理論)間隔のExcel(VBA)マクロを提供します。 ://www.quantdec.com/envstats/software/intervals.xls。私は試していませんが、 R
パッケージの toleranceは、幅広い許容範囲の間隔を提供しているようです(たとえば、回帰残差に適用するには、これらの式を変更する必要があります) 。
非中央スチューデントt分布は、ベースの qt
関数(およびその関連)を介して ncp
引数を介して利用できます> R のインストール。
ウォルド、A。、およびJ.ウォルフォウィッツ。 (1946)。 正規分布の許容限界。数理統計学年報 17 、208-215。
Guttman、I。(1970)統計的許容度地域:クラシックおよびベイジアン。 Hafner Publishing Co.、コネチカット州ダリエン。
(誤植があり、根本的な違いがないため、Gibbonsの参照は省略しています。)