んー

id:Z9M9Zさんから端的かつ的確なご指摘を受け、混合正規分布モデルを試してるんだけど・・・。
混合比を可変にするとEMアルゴリズムが収束しない(最大10000000回)場合がある。まほらばとか。作り方が悪いのかなあ。混合比1:1固定にすると最大200回程度で収束してくれるんだけど。うーんどうしたものか・・・。
http://www.neurosci.aist.go.jp/~kurita/lecture/statimage/node35.html
ここを参考に*1作ったんだけど・・・。

というか

EMアルゴリズムが収束しないって・・・。どっかおかしいのかなあ。1:1にするとk-meansとあまり変わらない結果に・・・って当たり前か。

いろいろ試してみたけど、結局は下の表以上の面白い結果は出なかったり。Χ2適合度検定も試してみたけど、分布に正規分布を仮定してるのがまずいっぽくてどうも有意な差が出ない。・・・うーん、とりあえず今回はここまで、かな。時間があったら考察としてまとめとこう。クラスター分析とか混合分布とかは、結構文献が多いっぽいので勉強しておきます。

今週のかみちゅはめちゃめちゃよかったので感想書きたいし、ロミオの青い空録画したのも見たいし、そろそろアニメ分補給しないとやばいかも・・・。

*1:分散の更新式、間違えてない??二乗の差じゃなくて差の二乗では・・・?