关于B站的“弹幕智能云屏蔽”功能
本帖最后由 xmcp 于 2017-12-24 23:44 编辑B站的安卓客户端有这样一个功能:(B站还在专栏上狠狠吹了一波来着)
官方的说法是,西比拉系统(误)会把弹幕分成10级,等级越高就代表这个弹幕越正常。然后你可以根据这个正常程度(反正没有官方的名字,就先这么叫了)的高低,屏蔽不够和谐的弹幕。
——话是这么说的,但我研究了一下,B站对弹幕正常程度的判定十分迷幻。
经过对相关API的分析,下面随机列举了《少女终末旅行 12》的部分弹幕和它们的正常程度:
<6> 好可爱
<9> 这内存超强
<10> 曾经的世界
<2> 哇~~~
<9> 高能开始
<7> 相机才是线索
<9> 超古代文明
<5> 金泽的记忆——人类的历史
<7> 真相只有一个
<5> 左上角
<1> 索尼相机
<7> 只能说这个相机真的好厉害呀
<9> 高能开始
<8> 实体的贾维斯
<6> 好几万张照片
<1> !!!!!
<5> 挺大内存的呢
<2> 自动接云盘?
<9> 全息投影
<8> 內存驚人
<5> 这个神兽可以啊
<6> 茶杯头
<6> 下季预告
<2> 女儿?
<9> 内存高到爆炸的照相机
<7> 相机还可以看视频
<9> 好熟悉的脸
<5> 大机器人
<9> 相机应该就是那个萝莉的
<2> 女儿?
<1> 大疆?
<1> 金泽。。。细思极恐
<1> 花泽香肠的原型机
<1> 金泽旁边女孩子小的时候
大家觉得1(最垃圾)和10(最正常)之间有那么大差别吗?我的内心甚至觉得,是不是1代表最正常、10代表最垃圾……
另外还有一个讽刺的事实,就是很多弹幕明明内容几乎一样,正常程度却有天壤之别:
<3> 含泪撒花
<5> 含泪撒花
<6> 哭着撒花
<6> 含泪撒千户
<2> 含泪撒花
<3> 含泪撒花
<6> 哭着撒花
<4> 含泪撒花
<2> 含泪撒花
<6> 哭着撒花
<8> 含泪撒花!
<6> 哇去
<5> 含泪撒花
<3> 含泪撒花
<10> 感伤撒花
<4> 含泪撒花
<5> 含泪撒花
<2> 撒花
<5> 含泪撒花
<1> 哇的一声哭出来
<5> 含泪撒花
<2> 含泪撒花
<7> 表情渐渐消失
<5> 含泪撒花
<6> 撒花泪目
<2> 含泪撒花
<3> 撒花
<2> 撒花
<4> 含泪撒花
<1> 含泪撒花????
<5> 含泪散花
<1> 撒花撒花
<3> 含泪撒花
<4> 含泪撒花
<3> 含泪撒花
<5> 含泪撒花
<3> 含泪撒花
<2> 含泪撒花
<7> 撒花~
<3> 哈?
<5> 含泪撒花
<6> 哭着撒花
<1> 含泪散花????
<1> 含泪撒花含泪撒花
<5> 含泪撒花
<2> 含泪撒花
<10> 不舍得啊呜撒花
<10> 含泪吃花
感觉启用“弹幕智能云屏蔽”基本上就相当于随机屏蔽了一半弹幕呀(笑)
所以,大家觉得B站的“弹幕智能云屏蔽”在追番的时候有用吗?
欢迎讨论或拿事实打脸。
关了不就行了 从来不用,自己屏蔽的够用了 为啥要看弹幕哪,档画面影响心情,如果喜欢看弹幕,不看垃圾弹幕也体会不到弹幕的精髓啊. 喷了,感觉是一个提取特征参数实时状态监视系统啊,好热门的东西呢。不知道有没有用上机器学习 KuonjiClara 发表于 2017-12-24 21:45
为啥要看弹幕哪,档画面影响心情,如果喜欢看弹幕,不看垃圾弹幕也体会不到弹幕的精髓啊. ...
只是B站简直要把这个功能吹上天了,从B站的那几张卖家秀截图来看,仿佛打开之后世界就美好了一样
六花自我中 发表于 2017-12-24 21:51
你们都是客户端追番么
不是,只是这个功能只有安卓客户端有,web版没跟进。我就拿客户端研究了一下。
“ios及电脑端相关功能正在加紧开发中,敬请期待。" ——哔哩哔哩社区小管家 2017.10.16 想看片子本身就关弹幕
想看舆论风评就看所有弹幕
一半一半感觉没什么意义 想看片子本身就关弹幕+1
想看舆论风评就看所有弹幕+2 这个应该是和用户相关的 还是有些用的。一般默认是6,感觉刷屏了,就8,如果特别热门,直接10。
屏蔽的依据,感觉主要靠弹幕单位时间内出现的次数。如果刷屏,就直接靠关键词格杀勿论,留下两三个飘过。
准确度确实一般,但比手动方便太多了。
本帖最后由 SevenYuan23 于 2017-12-24 22:22 编辑
有一个云屏蔽反馈群的,官方群的说法是“屏蔽力度算法主要包括等级,文本被屏蔽的信息,用户过往被举报的历史等” 只用pakku和自己以往手动屏蔽的列表,事实证明,你努力屏蔽一段时间之后,看到的会正常一些,因为一些重复的智障弹幕,其实就是那些人反复在刷的 同样内容什么等级都有就肯定是有很大部分是按用户来的了 所以依赖这种各种高大上的算法为什么不直接一个关闭来的轻松? fancl20 发表于 2017-12-24 23:13
先声明下这号最近都是知乎肥宅在用,我是号的原主不是著名知乎肥宅
刚才做弹幕云屏蔽的人说刚睡醒刷了下 s ...
并没有乱喷的意思,语气有点过激肥肠抱歉。
我的想法是不如去做弹幕点赞系统(link.acg.tv 里也有很多这样的建议),至少根据目前的情况来看,很难用一个算法去衡量弹幕的好坏(尤其是脱离视频的上下文的时候),人肉智能或许还靠谱一点。
而且不如把直接屏蔽的一刀切处理方式改成“调小字号/调低透明度”,这样即使有误伤也不会有太严重的影响。
(我更关心的问题是客户端的这些高级功能啥时候能同步到web端呀?除了云屏蔽之外,客户端的个性推荐都出了这么长时间了,是不是该考虑考虑web端的用户了呀……) fancl20 发表于 2017-12-24 23:13
先声明下这号最近都是知乎肥宅在用,我是号的原主不是著名知乎肥宅
刚才做弹幕云屏蔽的人说刚睡醒刷了下 s ...
既然做不好为什么要做 本帖最后由 冰星雨 于 2017-12-25 00:05 编辑
。 一直在用旧版本,讨厌各种恶心功能,关键词和正则够用了
Title
本帖最后由 冰星雨 于 2017-12-25 07:03 编辑fancl20 发表于 2017-12-25 00:06
你读书读不到全国第一就不读了吗
再说做不好也要看相对什么,相对没开是不是变好了,我们也有用户行为的 ...
, 没用过,看起来 s1也来个这样系统吧,就叫阿矿雷达。 还是手动调教吧 fancl20 发表于 2017-12-25 00:11
产品方面变化会比较慢(因为要怼产品,客户端开发 & 上线周期也长
弹幕点赞这个还是要产品来推动,可能会 ...
弹幕点赞功能太出戏,腾讯视频就有。看个正常的动画,飞过去个完全无关的韩国组合名字,几千赞还有喷子和地域黑也好多赞的 本帖最后由 hymbz 于 2017-12-25 02:27 编辑
@fancl20
我说得好像太简略了
读书好不好有一个具体的被大部分人所认同的评判标准 ,但弹幕云屏蔽没有。就想你说的那样,弹幕的质量是个很难去衡量的问题。不同的人有着不同的标准,再加上单条弹幕本身信息量过少,没法像分析文章那样有大量的文字量给你分析分类,同一弹幕在同一视频不同时间出现给人的观感可能完全相反。弹幕质量难衡量,不同用户需要屏蔽的弹幕也不同,弹幕云屏蔽的难点太多,而且现在也没有什么足够好的解决办法,这种情况下你们依旧推出了弹幕云屏蔽这个功能。我之前以为你们是有了不错的解决办法才会推出这个功能的,但看这贴好像效果并不太好。所以才问你们既然做不好为什么要做(推出这个功能),想知道你们是基于什么考虑?说了一大堆没用的只是想表示我没有喷的意思,相关功能我之前也有思考过只是好奇你们的想法而已。
我平常并不怎么用安卓端,所以只是好奇而已没有别的意思。你回答的收集用户数据我也想过,但没懂上线这个功能所收集到的数据有什么用。主要是不了解衡量标准,普通用户开了云屏蔽后看不到被屏蔽的弹幕,能感受到的只有「弹幕变少了」这一点。至于效果好不好,屏蔽掉的弹幕里有没有重要信息,普通用户都不知道。而且不管用户觉得好不好,都没有直接的反馈渠道来反馈(会可以点到联系客服那里去反馈的应该很少吧),用户可能因为弹幕云屏蔽看起来高大上而打开,也可能因为抱着「宁可放过一千也不杀错一个」而关闭,所以我现在挺好奇你们是怎么根据用户行为的指标来衡量是不是变好。 fancl20 发表于 2017-12-24 23:13
先声明下这号最近都是知乎肥宅在用,我是号的原主不是著名知乎肥宅
刚才做弹幕云屏蔽的人说刚睡醒刷了下 s ...
得了吧,这玩意儿就不可能做得好,别浪费时间了,结项目算了 fancl20 发表于 2017-12-25 00:06
你读书读不到全国第一就不读了吗
再说做不好也要看相对什么,相对没开是不是变好了,我们也有用户行为的 ...
你连上高中的学历都没有考什么大学啊,我估计B站可能是程序员太多又不能让他们闲着所以制造一些玩具项目让他们干,也算是业界的潜规则了,当然也可能人手很紧,但是有不想裁掉那些“思维活跃”的程序员坏了名声,所以就制造一些玩具需求让他们干着,再慢慢的开掉也是有可能的 fancl20 发表于 2017-12-25 14:31
做这种东西本身也是个 调整 -> 收集数据 -> 根据数据再进行调整的循环,包括屏蔽一些弹幕之后用户行为会 ...
能大概说说是怎样根据收集的数据来判断有用没用的吗?我很好奇这个。用户在观看视频时的行为想来想去就那么几种,还得考虑到不同用户行为习惯上的不同,实在想不出来你们是怎么判断的。当然了如果不方便说就算了,我也只是好奇随便问问而已。 我觉得其实只要上传用户的屏蔽列表,按照屏蔽人数的多少来区分等级,这就很足够了 泥潭前段时间推荐过的pakku,挺好用的
https://bbs.saraba1st.com/2b/forum.php?mod=viewthread&tid=1560803
页:
[1]
2