好評層と不評層 続き
なんでロールケーキはサンデーでサンドイッチはマンデーなんだろう。最近ずっとぱにぽにのOPをリピート再生してるから脳みそとけそう。あいあいあー。
それはそうと。上の好評層と不評層の続き。人の仕事を取っちゃうみたいで気が引けるんだけど、気になったので計算しました。こうしてみると、やっぱりこいこい7とフタコイなのか・・・。
タイトル | 好評層平均 | 不評層平均 | 差 |
---|---|---|---|
こいこい7 | 3.716 | 1.441 | 2.275 |
フタコイ オルタナティブ | 3.829 | 2.047 | 1.782 |
勇者王ガオガイガー -FINAL -GGG- | 3.790 | 2.043 | 1.747 |
ふたつのスピカ(再) | 3.893 | 2.178 | 1.715 |
これが私の御主人様 | 3.674 | 2.080 | 1.594 |
エルフェンリート(地上波) | 3.752 | 2.174 | 1.578 |
おジャ魔女どれみ ナ・イ・ショ | 4.000 | 2.500 | 1.500 |
英國戀物語エマ | 3.837 | 2.354 | 1.483 |
魔法先生ネギま! | 2.925 | 1.449 | 1.476 |
まほらば〜Heatful days〜 | 4.302 | 2.867 | 1.435 |
LOVELESS | 3.798 | 2.367 | 1.431 |
いちご100% | 2.670 | 1.252 | 1.418 |
ぷちぷり*ユーシィ(再) | 4.667 | 3.333 | 1.334 |
ああっ女神さまっ | 3.387 | 2.093 | 1.294 |
こみっくパーティーRevolution | 3.194 | 1.968 | 1.226 |
IZUMO〜猛き剣の閃記〜 | 2.474 | 1.257 | 1.217 |
ピーチガール | 2.954 | 1.823 | 1.131 |
JINKI:EXTEND | 2.142 | 1.095 | 1.047 |
眞田十勇士 | 2.000 | 1.000 | 1.000 |
宇宙交響詩メーテル | 2.000 | 1.000 | 1.000 |
モンキー・パンチ 漫画活動大写真 | 1.000 | 1.000 | 0.000 |
アルゴリズムは上で書いたとおり、確率的k-means(というアルゴリズムがあるのかは知らないけど)。例えば、k-meansのループの中で好評層の平均=3.5、不評層の平均=2.5となったとき、
- 3.5以上の評価はすべて好評層
- 2.5以下の評価はすべて不評層
- 2.5〜3.5の間の評価は確率的に決まる。具体的には各平均からの距離に反比例した確率で決まる。
評価値が5個しかないから、その中でクラスタリングというのは厳しそうなので確率変数にしてみた。そうすると今度は平均からの距離に反比例した確率で決まるので、評価5の人より評価4の人のほうが好評層に近いということになってしまう。それもおかしいなーというかんじで、意外と試行錯誤してしまいました。
この後、尤度比検定してp値出せばおっけーかな。眠いのでまた後でやろう。統計に詳しい方のツッコミお待ちしています(笑)
参考までに、プログラムのソース+windows用バイナリ。
http://kobayashi01234.hp.infoseek.co.jp/file/cluster.zip