統計検定準一級実践ワークブック26章まとめ
第一段階#
まず、各個体の座標を表すベクトルを$ x_{ij} $、$ \sum_{i=1}^{n}x_{i}=0 $、$ a=\sum_{i=1}^{n}||x_{i}||^{2} $(これをフロベニウスノルムという(ヒルベルト空間と関係が深いらしい))とおく。
ここからの式の組み合わせ方がよくわからなかったので、まとめなおす。
まず、
$$ d_{ij}^{2}=||x_{i}-x_{j}||^{2}=||x_{i}||^{2}+||x_{j}||^{2}-2x_{i}^{\top}x_{j} $$
と書かれている。これを$ x_{i}^{\top}x_{j} $イコールの形に変形すると、
$$ x_{i}^{\top}x_{j}=-\frac{1}{2}(d_{ij}-(||x_{i}||^{2}+||x_{j}||^{2})) $$
となる。ここで、下の二本の式
$$ \begin{cases}
\sum_{i=1}^{n}d_{ij}^{2}=a+n||x_{j}||^{2}\\
\sum_{j=1}^{n}d_{ij}^{2}=n||x_{i}||^{2}+a \end{cases} $$
をそれぞれ$ ||x_{i}||^{2},||x_{j}||^{2} $について解くと、
$$ \begin{cases}
||x_{j}||^{2}=\frac{1}{n}(\sum_{i=1}^{n}d_{ij}^{2}-a)\\
||x_{i}||^{2}=\frac{1}{n}(\sum_{j=1}^{n}d_{ij}^{2}-a)
\end{cases} $$
となる。これらを$ x_{i}^{\top}x_{j} $の式に代入すると、
$$ x_{i}^{\top}x_{j}=-\frac{1}{2}\Big{(}d_{ij}^{2}-\frac{1}{n}(\sum_{i=1}^{n}d_{ij}^{2}-a)-\frac{1}{n}(\sum_{j=1}^{n}d_{ij}^{2}-a)\Big{)} $$
$$ =-\frac{1}{2}\Big{(}d_{ij}^{2}-\frac{1}{n}\Big{(}\sum_{i=1}^{n}d_{ij}^{2}\Big{)}-\frac{1}{n}\Big{(}\sum_{j=1}^{n}d_{ij}^{2}\Big{)}+\frac{2a}{n}\Big{)} $$
とできる。
下ごしらえ#
詳しくは『あつまれ統計の森』のMDSのページ を参照。
縦ベクトル、横ベクトルの登場が唐突に思えるかもしれないが、該当の計算の必要な部分だけ抜き出すとそのようになる。 実際、 $$ J_{3}D_{3}= \begin{pmatrix}1&1&1\\1&1&1\\1&1&1 \end{pmatrix}\cdot \begin{pmatrix}d_{11}^{2}&d_{12}^{2}&d_{13}^{2}\\ d_{21}^{2}&d_{22}^{2}&d_{23}^{2}\\ d_{31}^{2}&d_{32}^{2}&d_{33}^{2}\end{pmatrix} $$ 計算すると、 $$ \begin{pmatrix} d_{11}^{2}+d_{21}^{2}+d_{31}&d_{12}^{2}+d_{22}^{2}+d_{32}^{2}&d_{13}^{2}+d_{23}^{2}+d_{33}^{2}\\ d_{11}^{2}+d_{21}^{2}+d_{31}&d_{12}^{2}+d_{22}^{2}+d_{32}^{2}&d_{13}^{2}+d_{23}^{2}+d_{33}^{2}\\ d_{11}^{2}+d_{21}^{2}+d_{31}&d_{12}^{2}+d_{22}^{2}+d_{32}^{2}&d_{13}^{2}+d_{23}^{2}+d_{33}^{2} \end{pmatrix} $$ となる。これは、
$$ \begin{pmatrix}\sum_{i=1}^{n}d_{i1}^{2}&\sum_{i=1}^{n}d_{i2}^{2}&\sum_{i=1}^{n}d_{i3}^{2}\\ \sum_{i=1}^{n}d_{i1}^{2}&\sum_{i=1}^{n}d_{i2}^{2}&\sum_{i=1}^{n}d_{i3}^{2}\\ \sum_{i=1}^{n}d_{i1}^{2}&\sum_{i=1}^{n}d_{i2}^{2}&\sum_{i=1}^{n}d_{i3}^{2} \end{pmatrix}$$ と表すことが出来る。ここで、同一列(i)の成分は全て同じなので、成分の中身は「行」つまりjの値に依存する。そこで、これを $$ \sum_{i=1}^{n}d_{ij}^{2} $$ と圧縮して表せる。気がする。
これで導出されたものを$ x_{i}^{\top}x_{j} $の式に代入する。
第二段階#
$$ x_{i}^{\top}x_{j}=B=\frac{1}{2}\Big{(}D_{ij}^{2}-\frac{1}{n}J_{n}D-\frac{1}{n}DJ_{n}+\frac{1}{n^{2}}J_{n}DJ_{n} $$
$$ =\Big{(}I_{n}-\frac{1}{n}J_{n}\Big{)}D\Big{(}I_{n}-\frac{1}{n}J_{n}\Big{)} $$ よってエッカートヤング分解周りの式が導出できた気持ちになる。