扭曲度测评——B站弹幕×S1专楼×K岛实况×老外评论
尝试一下统计不同论坛讨论的热词。这次选了 B 站、S1、K 岛和 AnimeSuki 。
虽然也想比较下 2ch ,但是一来不是一话一楼,二来数据不好弄,三来我不懂日语,就先放弃,如果有人有兴趣并且可以协助的话下次弄。
算法是先自动分词,然后挑选词频变化最大(方差最大)的前几十个词画 Stream Graph 。
后面也发现这一算法有点问题,尤其是对于键盘这种最终话贴数是第一话的一百倍的……以后再改进吧。
挑选的是最近的热门片。
虽说热门有各种标准,不过这里几乎是因为客观限制的,主要是两个:
1、在 S1 和 AnimeSuki 都是一话一楼,并且每楼回复数足够多(10 以上);
2、K 岛的新番实况保存室网盘链接未失效。
这次先弄这几个,下次有空再继续。
【Fate/Zero 第一季】
http://up.ieph.net/120721/fz.gif
【Fate/Zero 第二季】
http://up.ieph.net/120721/fz2.gif
【创圣的大天使EVOL(后半期)】
http://up.ieph.net/120721/evol.gif
【罪恶王冠(后半期)】
http://up.ieph.net/120721/gc.gif
【回转企鹅罐(后半期)】
http://up.ieph.net/120721/pd.gif
【命运石之门(后半期)】
http://up.ieph.net/120721/sg.gif
【魔法少女小圆】
http://up.ieph.net/120721/madoka.gif 神了 虽然看不懂但是好像很扭曲的样子
bilibili每集的宽度都很平均是因为弹幕池数量有上限的原因吗,除了B站以外其它三个站圆脸最后几话的讨论数都明显比前面的多,不过即使这样“大饼脸”还是顽强地出现了,不愧是大饼脸…… 统计局我有个建议
罪恶王冠请加入麻将脸表情统计功能 统计局威武 打不开? 我就说一点
罪恶王冠的s1统计表里面应该没有统计这个麻将脸进去。要不然肯定压倒性的贯穿始终 强帖前排 引用第3楼xpisces于2012-07-21 23:18发表的:
统计局我有个建议
罪恶王冠请加入麻将脸表情统计功能images/back.gif
王冠,绝非浪得虚名! 从小圆的分析来看,是不是可以说S1在推广活动中,没有哔哩哔哩来的给力呢,哔哩哔哩第三话学姐直接占了一个大头。。 好扭曲! 小圆的统计数据形状在三个论坛的形似度是最像的,左窄右宽,果然大家的看点都是在剧情上 又粗又长,前端膨大什么的........ 哪里看出来扭曲度? 论S1与岛的异同 引用第6楼lightingstar于2012-07-21 23:21发表的:
我就说一点
罪恶王冠的s1统计表里面应该没有统计这个麻将脸进去。要不然肯定压倒性的贯穿始终 images/back.gif
姑且把麻将脸也算作词的话,每话的讨论都出现的词反而不会出现在图上,因为会被当成常用词排除在参与作图的词以外,否则你看到的就是“的”字和逗号之类的东西贯穿始终了 bilibili 是因为选择弹幕文档做统计的原因吗?感觉特别水
回 15楼(cheyenne) 的帖子
啊?不对吧,就追加个定义词不就得了?别的还正常排除啊。要是用的排出词典就更简单了,完全没影响吧。 小圆地震前的第十话 完结后的11 12话的数据太充足的缘故么...那个图形的发展趋势太棒了啊...全程递增啊~ 卧槽 这是些什么玩意、、、 小圆的波状图竖着看真有点grief seed的感觉 结论之一是bilibili最没技术含量? 这把B站黑的渣都不剩了吧 贴吧呢? 我发现k岛对雁夜特别在意…… 壮哉我大统计局! B站因为是弹幕文件所以没法跟论坛回复比吧,毕竟没有人会在论坛刷yooooo和完结纪念这种东西的。
不过也从另一个方面反映出了弹幕缺乏营养… 虽不明,但觉厉 S1的专楼因为存在时间的关系和播放时间有挂钩的
当然最后一话的图像毫无疑问是神作的判定方式 引用第28楼fireboat42于2012-07-22 00:02发表的 :
B站因为是弹幕文件所以没法跟论坛回复比吧,毕竟没有人会在论坛刷yooooo和完结纪念这种东西的。
不过也从另一个方面反映出了弹幕缺乏营养… http://bbs.saraba1st.com/2b/images/back.gif
这没办法,弹幕绝大多数场合就是用来看热闹炒气氛的。
你想象一下把严肃的讨论帖拆成几行,在放映正片的同时滚动放送的场景…… 线条最扭曲的果然是S1 K岛和S1的相似程度最高,尤其是企鹅罐,同步率非常高。 壮哉统计局