Seber and Leeの線形回帰分析第2版の9ページに、私が理解していない2次形式の期待値の証明があります。
私が抱えている問題は、ゲートのすぐ外にあり、 $ \ mathbb {E}がどのようになっているのかわかりません。 [X ^ T AX] = \ operatorname {tr}(\ mathbb {E} [X ^ T AX])$ span>残りの証拠は得られると思いますが、ここにいる誰かが私を指摘できない場合この部分の正しい方向、私は永遠に感謝します!
Seber and Leeの線形回帰分析第2版の9ページに、私が理解していない2次形式の期待値の証明があります。
私が抱えている問題は、ゲートのすぐ外にあり、 $ \ mathbb {E}がどのようになっているのかわかりません。 [X ^ T AX] = \ operatorname {tr}(\ mathbb {E} [X ^ T AX])$ span>残りの証拠は得られると思いますが、ここにいる誰かが私を指摘できない場合この部分の正しい方向、私は永遠に感謝します!
Jonathan Christensenが指摘しているように、$ X ^ TAX $は$ 1 \ times 1 $行列です。実際、これは(単変量)確率変数です$$ X ^ TAX = \ sum_ {i = 1} ^ n \ sum_ {j = 1} ^ n a_ {i、j} X_iX_j。$$では、その期待値は何ですか?明らかに、$$ \ begin {align *} E [X ^ TAX] & = E \ left [\ sum_ {i = 1} ^ n \ sum_ {j = 1} ^ n a_ {i、j} X_iX_j \ right ] \\ & = \ sum_ {i = 1} ^ n \ sum_ {j = 1} ^ n a_ {i、j} E [X_iX_j] & \ text {期待の線形性による} \\ & = \ sum_ {i = 1} ^ n \ sum_ {j = 1} ^ n a_ {i、j}(\ sigma_ {i、j} + \ mu_i \ mu_j)& \ text {共分散式を適用} \\ & = \ sum_ {i = 1} ^ n \ sum_ {j = 1} ^ n a_ {i、j} \ sigma_ {j、i} + \ sum_ {i = 1} ^ n \ sum_ {j = 1} ^ n a_ {i、 j} \ mu_i \ mu_j& \ text {since}〜\ Sigma〜 \ text {は対称行列です} \\ & = \ sum_ {i = 1} ^ n [A \ Sigma] _ {i、i} + \ mu ^ TA \ mu \\ & = \ text {tr}(A \ Sigma)+ \ mu ^ TA \ mu \ end {align *} $$
$ X $は$ n \ times1 $ベクトルであるため、$ \ mathbb E [X ^ {T} AX] $は$ 1 \ times1 $行列です。トレースは対角エントリの合計ですが、$ \ mathbb E [X ^ TAX] $にはエントリが1つしかないため、そのトレースはその1つのエントリと単純に等しくなります。 $ 1 \ times1 $行列がスカラーと同等であると考えると、心配している等式は次のようになります。
基本的に、$ tr([3])$とは何ですか?これは明らかに3です。厳密に言えば$ [3] \ neq 3 $と主張するかもしれません。これは、一方が行列でもう一方が実数であるためですが、基本的には同等であり、少し緩い場合は表記法では、それらは等しいと言えます。
その背後にある直感を得るために、$ X $が単変量確率変数である場合、次のようになることを思い出してください。 \ begin {equation} E [a ^ {2} X ^ {2}] = a ^ {2} Var(X)+ E [aX] ^ {2} \ end {equation}
一方、$ X $がランダムベクトルの場合、$ X ^ \ prime AX = X ^ {\ prime} C ^ {\ prime} CXとなるように、$ A = C ^ \ prime C $とします。$、ここで$ C $は$ A $の平方根を示します。これは、$ A $が正定値であると想定していますが、この想定は説明のために課されています。その結果 \ begin {equation} E [X ^ {\ prime} C ^ {\ prime} CX] = Var(CX)+ E [CX] ^ {\ prime} E [CX] \ end {equation} したがって \ begin {equation} E [X ^ {\ prime} AX] = C ^ {\ prime} Var(X)C + E [X] ^ {\ prime} AE [X] \ end {equation}
最後に、$ A = C ^ \ prime C $であるため、$ C ^ {\ prime} \ Sigma C $を$ tr(A \ Sigma)$として表すことができます。明らかに、一般的なプロパティは$ A $の平方根を知る必要はありません。ただし、このプロパティがどこから来ているかはわかります。