感想率調査 別口解説 続き

just ideaですが。

ちょっと考えてるのが、まず確率モデルについて。

「自分の評価が他の人と比べてどうか」というのを比べるのに、評価点の差を見てるのがほとんどだと思うんだけど、はたしてそれだけでいいのかな、と。

例えば平均点3のサイトが2点を付けるのと、平均点4のサイトが3点を付けるのって、実は同じことじゃない?という気持ちがあって、要するに、アニメの評価値に関するパラメータとして

  • アニメ自体の特性
  • 評価したサイトの特性

を考えて、それぞれ別々に計算してみればまた違った側面が見えてくるんじゃないかなーということ*1です。「評価したサイトの特性」としては、
http://www33.ocn.ne.jp/~sakurahi/home/omoituki/kanso_ritsu0505s.html
こちらの「サイト別きびしさランキング」で求められていると思うので、これを評価値から引いてやれば、サイトの特性を除いた、アニメ自体の特性による評価値が求められるような気がするんだよなあ。

それが正しいかどうかはともかく、まだ誰もやってないみたいなので、やってみる価値としてはあるかな・・・

あと、モデルに直接関係ない、どんなデータを取るかについてだけど、自分と他のサイトとの類似性ランキングと一緒に、相手からみた自分のサイトの類似性ランキングを出してみたいなー。こっちは親友と思ってても向こうはそう思ってない、みたいな関係が出てくれば面白いと思うんだけど。

今のところそんなかんじ。統計の勉強を含めていろいろ勉強しないと実現しそうにないので、これを見た誰かがパパッとやってくれたら嬉しいなーというのを期待して書いてみました。もちろん自分でもやるつもりではいますが・・・

追記

っていうか、絶対統計に詳しいアニメファンっているはずなんだよな。俺はF検定の知識すらあいまいだし、お世辞にも統計に詳しいとは言いがたい。こういう場合に統計的に正しい確率モデルとか、どっかでフォローしてるひといないかなあ・・・。

*1:統計的に言うところの交互作用ってやつですね