Re:【向eph大致敬】【更新重要内容】以S1和豆瓣的评分差异
少的作品太多了,主要还是s1的样本太少了。Re:【向eph大致敬】【更新重要内容】以S1和豆瓣的评分差异
向统计局致敬!据说 统计局 是一个组织?
Re:【向eph大致敬】【更新重要内容】以S1和豆瓣的评分差异
没旧EVA的TV?没EOE?没COWBOY BEBOP?那这统计可以滚蛋了Re:Re:【向eph大致敬】【更新重要内容】以S1和豆瓣的评分差
引用第33楼eph于2012-12-13 13:11发表的 Re:【向eph大致敬】【更新重要内容】以S1和豆瓣的评分差异来划分动画类 .. :这个分析有几个问题。
首就先,聚类分析主要用于呈现数学上难以表示的高维分布,但是从我那两张图可以看出,这批数据接近于多元正态分布,只有一个聚集中心,所以无论你用什么聚类方法,都不会得到很好的结果。
其次,数据之间的关联性,对于实现标题的目的并不都有帮助。虽然“S1评分高豆瓣评分低”这样的类别是有意思的,但是如果你得到一个“S1投票人数20左右,豆瓣评分6左右”的类别,你会怎么解释呢——很可能这只是噪音而已。所以我觉得还不如就用那两张图各四个象限来分类更有说服力,刚好也是16类。
....... images/back.gif
单峰分布的聚类一样也是可以做的,因为聚类时要求类内距离最小,类间距离最大,举个最简单的例子,如果根据两个网站评分高低这个二维信息把作品分成两类,那么得到的结果显然应该是评分高的好作品一类,评分低的坏作品一类。
当然其他问题我还是同意的,首先样本的维度太低,信息量不够。这个确实是没法解决的硬伤。
其次,老作品和新作品的问题也确实存在。不过换一种思路看,一部连续十年每年都有十个人看的作品,和一部一年内就有一百个人看的作品,固然后者一时热闹,可是在不知后劲如何的情况下,也不能说一部十年了都不断在吸引人补番的作品没有后者知名吧。
至于这里做聚类比之于直接划分象限的意义……是因为如果数据只有二维的话,画一个平面图自然无比直观,但既然这里是四维的数据,不好画图。比如光看那两幅平面图,很难注意到夏目友人帐有多么特殊:夏目友人帐在每一项指标上都不是最最突出的,但如果把所有指标综合起来看,却是其他任何作品都难以接近的。再者,是简单用文字归类又会出现极端值不敏感的情况。比方说秒五,当然会归类到最热最好评的那个象限中去,但是这样做做聚类之后会发现秒五在豆瓣的不光是热,而且热度十分出奇,这就不是只用落在哪个象限能够描述的信息了。而反过来说那些在原点附近的平庸作品,看落在哪个象限也意义不大,此类作品本身就应该无视坐标轴的分割自成一类。
Re:【向eph大致敬】【更新重要内容】以S1和豆瓣的评分差异
豆瓣的投票还是不管年龄层和性别?我赌它还会继续刷出奇怪的结果Re:【向eph大致敬】【更新重要内容】以S1和豆瓣的评分差异
我来看看高达age被分到哪一类……什么?第五类!
Re:Re:【向eph大致敬】【更新重要内容】以S1和豆瓣的评分差
引用第46楼verywell于2012-12-13 19:41发表的 Re:【向eph大致敬】【更新重要内容】以S1和豆瓣的评分差异来划分动画类 .. :没看懂分类说明
能写成豆瓣评分高,S1评分低这种形式么
看了第二遍看懂了…… images/back.gif
俺文科生没文化智力低,求解
Re:【再次更新了】【向统计局致敬】以S1和豆瓣的评分差异
@择日传奇@verywell
在主楼加入了一个更直观的说明,也许现在看起来会容易明白些?
Re:【再次更新了】【向统计局致敬】以S1和豆瓣的评分差异
能不能把1-16组的范围在图中画一下……Re:【再次更新了】【向统计局致敬】以S1和豆瓣的评分差异
从具体分析结果来看, 我认为聚类分析是不成功的,至少有一半类的内容没有可读性。统计局的图是以直角坐标系的方式列出的,但我觉得在做类分析的时候,S1和豆瓣的评分和热度都不能作为两个垂直的坐标轴来看待。Re:【再次更新了】【向统计局致敬】以S1和豆瓣的评分差异
连我大Q娃都没有(嫌弃脸Re:【再次更新了】【向统计局致敬】以S1和豆瓣的评分差异
我以为王牌投手会是S1和豆瓣的交叉点,两边口碑应该都不错......找一找.......什么竟然在第四组?
Re:【再次更新了】【向统计局致敬】以S1和豆瓣的评分差异
看到第三组只有夏目友人帐,就在表里搜虫师没找到——上映太早所以客观区没收录
所以我从这个表得到的启发是:客观区该开老番鉴赏了
统计学基本还了,但隐约觉得分类有不合理……
手头没软件了,想问问16个类的评分均值和方差分别是多少?想想还是不问了…… @月珥
就问下,是否适合做显著性分析?似乎是数据符合正态分布,则直接对结果作方差分析;不符合则做非参数检验
不知能不能做个套图:以完结时间为作品子集(以客观区的总结帖为依据),以分数为纵坐标、以作品名为横坐标,S1和豆瓣作为两个分类、得分做成并列的柱状,会不会得到更直观的结果呢?
另外再加上以投票数作颜色深浅(有这个功能吗我突发奇想的……http://bbs.saraba1st.com/2b/images/post/smile/dym/150.gif
Re:Re:【再次更新了】【向统计局致敬】以S1和豆瓣的评分差
引用第54楼小小小黑屋于2012-12-13 23:23发表的 Re:【再次更新了】【向统计局致敬】以S1和豆瓣的评分差异来划分动画类 .. :我以为王牌投手会是S1和豆瓣的交叉点,两边口碑应该都不错
......找一找.......什么竟然在第四组?
images/back.gif
这就是为什么我说因为数据量有限所以不能保证全部准确了。我查了查另一个不同参数下的结果,王牌投手是跟以下作品同列一组的:
夜之曲 交响情人梦 巴黎篇 波菲拉斯的漫长旅程 华丽的挑战 超智游戏 道子与哈金 第一神拳 新挑战者 忏·再见绝望老师 东京里氏 8.0 空中秋千 青色文学系列 胡子小鸡 四叶游戏 天体战士 第二季 犬夜叉 完结篇 交响情人梦 最终乐章 王牌投手振臂高挥~夏季大会篇~ 江户盗贼团 五叶 超元气三姐妹 荒川爆笑团第二季 海月姫 爆漫王 好想告诉你2 超元气三姐妹 增量中 纯情罗曼史2 异邦人 无皇刃谭 基友英雄传 赌博破戒录 恶魔阿萨谢尔在召唤你 超时空甩尾 少年同盟 世界第一初恋 第二季 滑头鬼之孙2 千年魔京 爆漫王 第二季 坂道上的阿波罗 鲁邦三世 名为峰不二子的女人 钓球 少年同盟2 复仇者:世上最强英雄组合 第2季 降世神通:科拉传说 第一季 轻音少女剧场版 摇曳百合 第二季 写给桃子的信
也就是对应主楼的15组,亦即豆瓣众非常喜欢,S1虽然好评但是真正感兴趣的不太多的那一类作品。
当然其实比较一下这两个结果,可以看到不同参数之下结果还是大体一致的,尽管确实会有个别的作品表现不稳定。
@小小小黑屋
Re:【再次更新了】【向统计局致敬】以S1和豆瓣的评分差异
其实我还是那句话,EVA和CB被吃到哪里去了?看到分类3的单例的时候我就只能笑而不语提出这个问题追加:嘛,仔细看了看也全都是些新动画,建议在标题追加“新番”两字
Re:Re:【向eph大致敬】【更新重要内容】以S1和豆瓣的评分差
引用第36楼nsevit于2012-12-13 14:04发表的 Re:【向eph大致敬】【更新重要内容】以S1和豆瓣的评分差异来划分动画类 .. :超级机器人大战OG -The inspector-
这个为什么豆瓣会喜欢完全搞不懂啊!! images/back.gif
因为它也属于楼上说的那种边缘作品,换换参数可能就会跑去一些不该去的地方。另一种参数下它跟以下作品同组:
电波少女 第二季 Mission-E 恋姬无双 鹡鸰女神 乃木坂春香的秘密 出包王女 二十面相少女 零之使魔 三美姬的輪舞 风云决 尸姬 赫 CHAOS;HEAD 魔法学园MA 美肌一族 十字架与吸血鬼 CAPU2 夜樱四重奏 超能力少女 兰(心灵感应少女) 茜色坡道 深渊传说 武装机甲 毒蛇信条 明日的与一 尸姬 玄 机巧魔神 穿越宇宙的少女 钢壳都市雷吉欧斯 战场的女武神 香格里.拉 花冠之泪 海物语~有你陪伴~ 公主恋人 简单易懂的现代魔法 死刑判决 肯普法 圣剑锻造师 机巧魔神 第二季 大小姐×执事! 守护猫娘绯鞠 吸血鬼同盟 最后大魔王 薄樱鬼 亲吻姐姐 闪光的夜袭 圣痕炼金士 迷途猫OVER RUNMayoi Neko Overrun 大神与七位伙伴们 鹡鸰女神 第二季 玩伴猫耳娘 MM一族 百花缭乱 武士少女 梦色蛋糕师 心灵侦探八云 FORTUNE ARTERIAL赤之约束 超级机器人大战OG -The inspector- SD高达三国传 Brave Battle Warriors IS<Infinite Stratos> 食梦者玛丽 零度战姬 腹黑妹妹控兄记 DOG DAYS 圣痕炼金士Ⅱ 亚斯塔露蒂的玩具 七合圣石战记 迷茫管家与懦弱的我 萝球社 歌之☆王子殿下 战国少女 桃色Paradox 迷糊软网社 潜行吧!奈亚子 宝石宠物 Tinkle 快盗天使Twin Angel 吸血猫 魔乳秘剑帖 C?魔方少女 纯白交响曲 请认真的和我恋爱! 黑岩射手 战姬绝唱Symphogear 竖笛与双肩书包 第一季 要听爸爸的话 真田十勇士 潜行吧!奈亚子(重复) 枪械少女 超魔人 最强会长黑神 第一季 女皇之刃 叛乱 Ozuma AKB0048 第一季 轮回的拉格朗日 第二季 DOG DAYS 第二季 战国大乱斗 无赖勇者的鬼畜美学 弑神者! 足球骑士 柴犬子 恋爱与选举与巧克力
对应的是主楼的第7组,也就是不好不坏不冷不热的最最平庸的一组。
@nsevit
Re:Re:【再次更新了】【向统计局致敬】以S1和豆瓣的评分差
引用第57楼加贺正午于2012-12-14 00:10发表的 Re:【再次更新了】【向统计局致敬】以S1和豆瓣的评分差异来划分动画类 .. :其实我还是那句话,EVA和CB被吃到哪里去了?看到分类3的单例的时候我就只能笑而不语提出这个问题
追加:嘛,仔细看了看也全都是些新动画,建议在标题追加“新番”两字
images/back.gif
这您得去问投票区版主为什么不开旧番评分……
Re:【再次更新了】【向统计局致敬】以S1和豆瓣的评分差异
只想知道S1高 豆瓣低的到底是哪些。。。最极端的是哪部。。。Re:Re:【再次更新了】【向统计局致敬】以S1和豆瓣的评分差
引用第57楼加贺正午于2012-12-14 00:10发表的 Re:【再次更新了】【向统计局致敬】以S1和豆瓣的评分差异来划分动画类 .. :其实我还是那句话,EVA和CB被吃到哪里去了?看到分类3的单例的时候我就只能笑而不语提出这个问题
追加:嘛,仔细看了看也全都是些新动画,建议在标题追加“新番”两字
images/back.gif
S1都没开楼评分,何来的对比
新番不新番,08年也算新番的话
回 楼主(月珥) 的帖子
恩,加了注解之后方便理解多了。夏目友人帐原来是老少咸宜啊!
圆神原来是这个档次的神作啊!
Re:Re:Re:【再次更新了】【向统计局致敬】以S1和豆瓣的评分
引用第59楼月珥于2012-12-14 00:13发表的 Re:Re:【再次更新了】【向统计局致敬】以S1和豆瓣的评分差异来划分动画 .. :这您得去问投票区版主为什么不开旧番评分…… images/back.gif
其实EVA旧TV和CB(尤其是后者)在S1投票区真开了的话,评价不会低的,我只是觉得现在两边都非常认可的只有夏目也未免悲哀了点。
Re:【李菊福的v4.0版】【向统计局致敬】以S1和豆瓣的评分
更新了v4.0版,加入了均值方差信息,更有理有据了!顺便大家一定要仔细看第2组和第16组的成员,S1漫区生态一览无余
Re:Re:Re:【再次更新了】【向统计局致敬】以S1和豆瓣的评分
引用第61楼ayase_dd于2012-12-14 00:42发表的 Re:Re:【再次更新了】【向统计局致敬】以S1和豆瓣的评分差异来划分动画 .. :S1都没开楼评分,何来的对比
....... images/back.gif
对我来说2000年之后都可以叫做新番,尤其是一季商业模式出现之后
再说,如果有旧番的投票,想必这对比榜单也不会只出现一个可怜的夏目是两边叫好,也能给豆瓣和S1冷艳高贵互相看不惯的双方增加点和气,何乐而不为?
Re:【李菊福的v4.0版】【向统计局致敬】以S1和豆瓣的评分
歌牌和FZ,未闻花名这两片一组?难道是黑的还不够?回 66楼(加贺正午) 的帖子
但鉴赏区最有参考意义的其实是漫区众对于CGR2的评分,会笑而不语的永远会笑而不语顺便地,如果真要搞一堆老动画评分,那么这边也最好再加个年龄段选项
Re:【李菊福的v4.0版】【向统计局致敬】以S1和豆瓣的评分
最后一组俨然是现阶段漫区众生态报告,羞羞哦Re:Re:Re:Re:【再次更新了】【向统计局致敬】以S1和豆瓣的评
引用第66楼加贺正午于2012-12-14 01:07发表的 Re:Re:Re:【再次更新了】【向统计局致敬】以S1和豆瓣的评分差异来划分动 .. :对我来说2000年之后都可以叫做新番,尤其是一季商业模式出现之后
....... images/back.gif
别钻牛角尖了,看菜吃饭,量体裁衣,鉴赏区的数据就这么点
页:
1
[2]