質問:
線形回帰の説明
rottentomato56
2013-05-23 05:17:29 UTC
view on stackexchange narkive permalink

単純な線形回帰を説明する際に、散布図を通る直線を示すことは、多くの例で少し誤解を招くことではありませんか?これは、線形回帰が独立変数と従属変数に何らかの直線関係がある場合にのみ機能することを示唆しているようですが、線形回帰の「線形」は実際にはモデルのパラメーターの線形を指しますか?

三 答え:
Glen_b
2013-05-23 09:02:44 UTC
view on stackexchange narkive permalink

まあ、それは予測子でも線形です。

たとえば、2次式に当てはめると、「線形ではなく、参照してください」と言うことがあります...しかし、そうです! $ x_1 = x $ span>および $ x_2 = x ^ 2 $ span>で、 $ x_1 $ span>と $ x_2 $ span>、 $(1)では確かに線形です、x_1、x_2)$ span>。与えた予測子では線形です。

$ x_1 = \ sin(\ pi x)$ span>および $ x_2 = \ cos(\ pi x)$ span> ...ええと、 $(1、x_1、x_2)$ 。

など。

$ x $ span>を慎重に選択することで、使用できます。曲線を近似するために、しかしそれはあなたがそれを与えるものにおいてまだ線形です。

局所多項式(カーネルタイプ)近似でさえ、実際には予測子では線形です。全体を1つの大きな線形モデルとして記述できます。

$ E(y)= X \ beta $ span>の場合、 $ X \ beta $ span>は、 $ X $ span>(Xの列)または $ \ beta $ span>。

しかし、そうです、linear-in-the-parametersは、線形回帰の「線形」が意味するものです。

回帰が曲線に適合できる場合、基本的なプレゼンテーションが常に直線の関係を描いていることは、少なくとも部分的に誤解を招く可能性がありますか?おそらく、しかしあなたはほとんど行から始めなければなりません。

+1、これはそれを置く良い方法です。二乗項を超えて議論を拡張することは私には思い浮かばなかった。
私の逸話的な経験では、ほとんどの線形回帰は実際には直線です。とは言うものの、一部のフィールド/アプリケーションでは、たとえばデータのログで回帰するなど、回帰する前にデータを変換するのが一般的です。そうです、多くの人は(理解と応用の両方で)直線的な概念を超えることは決してありません。その意味で、線形回帰の本質が以前に明確にされていないのは不幸です。
gung - Reinstate Monica
2013-05-23 07:27:42 UTC
view on stackexchange narkive permalink

確かに、線形回帰または線形モデルの「線形」は、実際にはパラメータの線形を表します。つまり、推定しているパラメータは係数です。

ただし、その価値については、多項式でモデル化された曲線の外観関数(たとえば、$ Y = \ beta_0 + \ beta_1X_1 + \ beta_2X_1 ^ 2 $)は実際にはモデルを2次元散布図にプロットし、 $ X_1 $と$ X_1 ^ 2 $を同じ基になる変数と見なしている場合でも、重回帰モデル。しかし、適切なスペースに配置されている場合、それは実際には直線/平面です。

$ X_1 $と$ X ^ 2_1 $の関係は曲線であるため、3次元プロットでも見づらい場合があります。しかし、コークス缶をスライスする完全に平らな平面を想像してみてください。平面の観点からは、平面が缶の壁と交差する線は直線です。平面を通してこれを完全に真っ直ぐに見ているように配置できれば、関数が線形であることがわかります。

更新:これが私の答えでうまくいった例があります:多項式回帰が多重線形回帰の特殊なケースと見なされるのはなぜですか?

Greg Snow
2013-05-23 05:53:16 UTC
view on stackexchange narkive permalink

まあ、単純線形回帰は通常、予測子が1つしかないモデルを指すため、関係は線形になります(変数を変換すると、変換された変数間の関係は線形のままになります)。

多くの曲線関係は、単純な線形回帰から複数の線形回帰に移行する多項式またはスプラインを使用してモデル化されます。

単純な線形回帰を教えるときは、ティーザーも実行しようとします。その曲線関係もモデル化できますが、学生は詳細を学ぶために別の統計コースに戻る必要があります(または、これらのモデルに適合するように統計学者に相談する必要があります)。

それは非常に小さな点ですが、私自身の推測では、すべての科学において、指数、対数、三角関数と双曲線関数、およびよりエキゾチックな関数を含む曲線関係は、多項式とスプラインを上回っています。 「Most」を「Numerous」または「Verymany」に編集すると、完全に安全な場所にいます。


このQ&Aは英語から自動的に翻訳されました。オリジナルのコンテンツはstackexchangeで入手できます。これは、配布されているcc by-sa 3.0ライセンスに感謝します。
Loading...