質問:
カーネル密度プロットのy軸はどういう意味ですか?
nachocab
2013-01-20 07:39:24 UTC
view on stackexchange narkive permalink

重複の可能性:
1を超える確率分布値は問題ありませんか?

下の領域は密度関数の曲線は、x値の範囲の間でx値を取得する確率を表しますが、帯域幅を小さくすると、y軸を1より大きくすることができますか?このRプロットを参照してください:

  range <- seq(2,6、.01)n <- 1000d <- sample(range、n、replace = TRUE)d <- c(d、 rep(0,100))d <- c(d、rep(1,50))df <- data.frame(counts = d)adjust <- 1 / 20dens <-density(d、adjust = Adjust)plot(dens)  

enter image description here

また、$ P(x<2)= \ frac {150} {1000} =。15 $を取得する確率はどのようにわかりますかこれはプロットにありますか?

$(0,0.1)$の均一な密度を考えてみましょう。その範囲の密度の高さはどれくらいですか?密度は確率ではありません。
密度は「単位確率」です。
1 回答:
Jonathan Christensen
2013-01-20 07:52:37 UTC
view on stackexchange narkive permalink

正解です

密度関数の曲線の下の領域は、x値の範囲間でx値を取得する確率を表します

ただし、面積は高さだけではありません。幅も重要です。したがって、0にスパイクがある場合、幅が非常に小さい場合(たとえば、0.1)、高さは1よりかなり高くなる可能性があります(スパイクが完全に長方形の場合、$ 0.1 \ times10 = 1 $であるため、最大10)。確率のルールに違反することなく。スパイクの高さは大きいですが、スパイクの下の領域はまだかなり小さいです。

同じ理由で、連続確率変数の密度関数は1より大きい値を持つことができます。たとえば、Normal(0,0.0001)pdfをプロットすると、ピークが非常に高いことがわかります。

最初は2番目の質問を見逃しましたが、$ P(x<2)= \ frac {150 } {1000} =。15 $は、2の左側の曲線の下の領域(つまり、0と1の2つのスパイクの領域)が.15であることを意味します。

ありがとう、それは理にかなっています。 Rでは、 `library(pracma); trapz(dens $ x [dens $ x <2]、dens $ y [dens $ x <2])`を実行でき、 `.139`を取得します。十分近い


このQ&Aは英語から自動的に翻訳されました。オリジナルのコンテンツはstackexchangeで入手できます。これは、配布されているcc by-sa 3.0ライセンスに感謝します。
Loading...