亚瑟邓特 发表于 2018-11-12 12:38

Narcissu14 发表于 2018-11-12 13:08

爱情半月餐 发表于 2018-11-12 11:57
新片效应在总榜根本无法减弱,添加筛选之后,还是别提供总榜了,想保留就加个时间系数合理点 ...
这个系数的多少很难控制啊,不太好量化。我的看法是,加颜色标识下当季新番。

hein 发表于 2018-11-12 13:14

本帖最后由 hein 于 2018-11-12 13:16 编辑

Narcissu14 发表于 2018-11-12 13:08
这个系数的多少很难控制啊,不太好量化。我的看法是,加颜色标识下当季新番。 ...
用该动画的当年所有或者前一季当季后一季三季的全部动画分数做模型。

hrhrhrk 发表于 2018-11-12 13:17

Narcissu14 发表于 2018-11-12 11:27
上图分别是MAL和SATI的Clanned After Story评分人数,可见按人数加权是不合理的。
为什么中日欧美:上面 ...

1.不是说按人数加权靠谱,只是比你这样更靠谱。至少还有数学意义。

2.为什么均1/3不行?
这是我先问你的。
请问你为什么要均1/3?其意义是什么?为什么你觉得把你选的这几个榜按地区各给1/3的权重就是“客观的计算方式”了?
这种做法从根子上就是烂的。

3.评分的处理
你真的好好看了吗?
如果a站评分集中在9~10分,b站在0~10上均匀分布,不经标准化直接平均必然b站影响更大。当然不是指会有网站评分是标准的均匀分布。
没看懂的话,拿泥潭评分举例:
鉴赏区国王游戏97%打最低分-2,假设换算成十分制约为0分,而在mal为5.17分
鉴赏区95攻壳96%打最高分+2,假设换算成十分制约为10分,而在mal为8.34分
即使不熟悉mal,也可以推测出,mal不论是贬低还是赞扬,在总体评分上都没有s1那么极端。
实际上mal最低分在2分左右,不到3分的仅占千分之一,而最高分只有9.24,9分以上也仅占约千分之一,反观s1鉴赏区不到2000部作品,“9分”以上却有20个。(根据https://myanimelist.net/topanime.php?limit=10000)
如果把s1评分和mal平均的话,显然s1的口味会更多的影响平均评价。你可以设想两部s1和mal分位完全相反的动画在你的榜单里的位置。
你这五个网站也一样,方差更大的评分网站对总体评分影响更多。如果你有多元统计基础的话可以回忆一下因子分析和主成分分析里是怎么描述方差的,其实是一个道理。
这玩意也很好处理,你无论如何都想平均的话,各自换算成一个标准分再平均就行,想要噱头的话还可以试试日本人喜欢用的“偏差值”。
直接平均,这是耍流氓。

Narcissu14 发表于 2018-11-12 13:24

hein 发表于 2018-11-12 13:14
用该动画的当年所有或者前一季当季后一季三季的全部动画分数做模型。

这是个不错的方案,我会考虑下具体实现的

BRRM 发表于 2018-11-12 14:11

shenz 发表于 2018-11-12 11:08
支持楼主,楼主只想做个综合他站的实时的评分参考出来,怎么那么多人要楼主做个评分权威出来?你们这不是难 ...

赞同

YoumuChan 发表于 2018-11-12 14:34

投票人数问题的话,可以通过取95%置信区间的下界作为作品评分
跨平台问题的话,可以在用上述方法算出每个作品的分数以后用 (作品分数-该平台平均分)/标准差 作为进行加权平均时的分数

AolKleinZ 发表于 2018-11-12 14:40

Sacross 发表于 2018-11-12 15:16

取上下限拉平呗真不行,简单粗暴有点成效的方法才是核心的吧
顺便真不把泥潭鉴赏区一并加上么,再来个方差啥的?

虽然给不怎么关心的人看这样已经差不多了,剩下其实就是数据可视化的改进了……

Narcissu14 发表于 2018-11-12 15:34

hrhrhrk 发表于 2018-11-12 13:17
1.不是说按人数加权靠谱,只是比你这样更靠谱。至少还有数学意义。

2.为什么均1/3不行?


也就是说需要考虑某个网站某动画极端评分数据下的平均分失实,对总榜造成影响的问题。
其实这个榜单,目的是为了体现中、日、欧美这三个主要的动画观众群体的相对一致喜好,作为大家看番的一个参考,不是为了打造一份权威性的榜单,而且数据来源也并不是权威数据,而是大众评分。你说的问题是客观存在的,我不否认这点,但这实际上也是我想反映在榜单的,而不是人为地去改动它。例如《在这世界的角落》,中国观众不能认同的一些内容和价值观,在其他文化和价值观的群体眼中则会不同,所以目前我没有理由去调整某个网站的分数。
关于1/3,其实这只是一个大致上的限定,并不是真的就3均分。权重还是按网站评分的可靠性来分(当然,这也是目前我自己的主观判断下设置的,随时可根据建议修改),1/3只是作为一个限定要素,避免某个群体的评分主导了总评分。

macos 发表于 2018-11-13 07:44

fuochai 发表于 2018-11-13 08:11

弱弱问一句冰菓在哪……
翻了好几页都没看到啊

Mostovoi 发表于 2018-11-13 09:11

LZ可以考虑增加一个搜索功能
页: 1 [2]
查看完整版本: 做了个富时效性的排行向视频和小网站