rpart
オブジェクトの概要でのCPの計算について少し混乱しています。
この例を見てください
df <- data.frame(x = c(1、2、3、3、3)、y = factor(c( "a"、 "a"、 "b"、 "a"、 "b"))、 method = "class")mytree<-rpart(y〜x、data = df、minbucket = 1、minsplit = 1)summary(mytree)Call:rpart(formula = y〜x、data = df、minbucket = 1、minsplit = 1)n = 5 CP nsplitrelエラーxerrorxstd1 0.50 0 1.0 1 0.54772262 0.01 1 0.5 20.4472136変数の重要度x100ノード番号1:5の観測値、複雑さparam = 0.5予測クラス=予想損失= 0.4P(ノード)= 1クラス数:3 2確率:0.6000.400左息子= 2(2 obs)右息子= 3(3 obs)一次分割:x < 2.5左、改善= 1.066667、(0欠落)
ルートノードの場合、要素を誤って分類する可能性があるため、CPは0.4である必要があると思います。ルートは0.4で、ルートのツリーサイズは0です。0.5はどのように正しいCPですか?