user3459010
2015-07-31 12:50:34 UTC
線形回帰用のこのRコードがあります:
fit <- lm(target〜age + sales + Income、data = new)
クックの距離に基づいて影響力のある観測値を特定し、Rのデータから同じものを削除する方法は?
これは良い例であり、ロバスト回帰を使用して影響力のあるポイントを含むデータを処理する方法も紹介しています。http://www.ats.ucla.edu/stat/r/dae/rreg.htm将来的には、質問する前に、もう少し調査を試みる必要があります。
クックの距離を使用して「影響力のある」観測値を特定するためにさまざまな基準が提案されており、それらのいくつかは互いに大きく異なるため、「R」に焦点を当てていますが、ここには意味のある統計的質問があると思います。(私の経験では、コードがよく知られている@Roland--withによって参照される `rlm`関数は、*小さな残差*を持つ非常に影響力のある観測に関連する問題を識別も評価もしないため、あなたが行っていないと結論付けることはありません。あなたの研究。)
@Roland-これを投稿する前に、自分の調査を行っていないと感じさせる理由がわかりません。私はあなたが共有したこのリンクに出くわしました、しかしそれは私には役に立たなかった!将来的には、そのような役に立たない記事へのリンクを与えるのではなく、適切なコードを私に与えるという点で、解決策でより良い応答をする必要があります!
[クックの距離プロットの読み方](http://stats.stackexchange.com/q/22161/17230)と[クックの距離カットオフ値](http://stats.stackexchange.com/q)での議論/ 87962/17230)。