找回密码
 立即注册
搜索
查看: 1940|回复: 26

[青黑无脑不要游戏只求一战] 有关中文汉化对Steam的简体中文玩家的评论数量和倾向的影响

[复制链接]
     
发表于 2025-9-14 14:50 | 显示全部楼层 |阅读模式
本帖最后由 gzGaryC 于 2025-9-15 15:15 编辑

前情提要:https://stage1st.com/2b/thread-2248659-1-1.html
特别鸣谢:
steam游戏中文及中文评论概况统计(ver.2024.11) frankCC坛友提供的灵感

楼主在今年年初发过帖子询问坛友对中文游戏本地化的看法和评论习惯。最近完成了一篇关于游戏中文本地化对Steam简体中文玩家影响的社科专业硕士论文,想和大家分享一些有意思的发现。研究结果单纯基于对数据的定量分析,不包含任何定性数据(比如评论的具体内容)。


研究背景
这几年越来越多游戏提供中文支持,但中国玩家的差评却越来越多。2024年简体中文已经成为Steam第一大语言,占到了33.7%,超过了英文,是汉化游戏的增加没让没让中国玩家更满意,还是另有其因?
为了搞清楚这个问题,我收集了8797款Steam游戏的数据,这些游戏都是2010到2025年间发布的,每款至少有100条评论,且简体中文和英文评论数不少于20条,DLC等非游戏内容在数据收集过程中已被排除。通过Steam API和对商店页面爬虫获取了游戏信息、价格、评论数据、标签等各种信息。数据收集截止时间为2025年的6月中旬。Steam API只能提供游戏对某种语言的支持的数据,比如某游戏对英文有文本和语音支持,对中文只有文本支持。也许可以通过开发商或者发行商的名字区分是否为本土开发者,但是我没想到特别好的实践方法。
这里假设绝大多数中国玩家都会用母语(简体中文)留评论,因此用简体中文的评论数据来代表Steam平台上的中国玩家,数据分析不涉及繁体中文评论。游戏价格为数据收集时的游戏全价。游戏标签采用因子分析的形式降低复杂度,生成20个独特的品类加入到回归分析中,这20个品类可以覆盖样本里50%的游戏。

我的两个研究假设
假设1:汉化程度越高,从无汉化到文本汉化再到文本+语音汉化,中国玩家的参与度会越高。我用简体中文评论占总评论的比例来衡量参与度。这里使用Beta回归。
假设2:汉化程度越高,中国玩家相对于一款游戏的评价会更积极。 使用Steam上评论占比最多的英文评论(抽象理解为其他地区的玩家)作为对照,我用中文好评率(推荐率)减去英文好评率的差值来衡量,负值说明中国玩家评论相较英文评论更加负面。因为OLS模型的异方差性,这里使用WLS。

主要发现假设1得到强烈支持
汉化确实能显著提高中国玩家参与度。文本+语音汉化能让中国玩家评论的可能性提高129%,OR值达到2.29。仅有文本汉化也能提高102%,OR值为2.02。这些结果的p值都小于0.001,统计显著性极高。
不同类型游戏的效果还不一样。文字密集型游戏比如视觉小说和剧情向游戏,汉化的正面效果能额外加成35%;对于独立游戏(带Indie标签),汉化效果能加成21%;售价50元以下的低价游戏(不包括免费游戏),汉化带来的参与度提升最明显。

假设2没有得到支持
汉化并不能改善中国玩家对于一款游戏的相对评价。全汉化对评价几乎无影响,系数接近0。文本汉化虽然统计显著,但实际效果微乎其微,系数仅有0.01。
回归模型里真正影响评价差异的是游戏发售时间。对于2020年后的游戏,简体中文玩家的评论倾向相对于写英文评论玩家明显更负面。2022到2025年这个趋势急剧恶化。时间因素的影响力远远超过了汉化本身。

一些有趣的细节中国玩家的游戏偏好
通过分析发现中国玩家对某些游戏品类的参与度明显更高,包括赛车模拟器、视觉小说、第三人称潜行、格斗游戏和2D平台跳跃游戏。
价格与汉化的微妙关系
3A大作,也就是200元以上的游戏,汉化已经是标配,能缓解7%的负面评价。但中等价位(120到200元)的游戏,全汉化反而可能招致更多批评。独立游戏如果只做文本汉化,评价反而会下降2%。
时间趋势的深层含义
一种可能的解释是中国玩家群体经历了多年高质量民间汉化的熏陶,形成了独特的"汉化品味"。当官方汉化质量达不到期待时,反而会引发更强烈的批评。
另外,
中国玩家使用Steam评论的方式可能有别于其他地区的用户,这种批判性评论也成为了展示游戏品味的一种方式。
研究局限
我的研究有几个局限性。首先我假设所有人用母语评论,评论语言占比不能简单与购买游戏的玩家使用的语言对齐(比如we need chinese属于英文评论);实际上双语玩家更可能会策略性地选择评论语言(上次小问卷就有坛友提到更喜欢用英语评论)。其次无法追踪民间汉化的影响,很多老游戏其实有汉化组补丁,但数据上显示为"无汉化"。另外我仅分析了Steam评价的“推荐”或“不推荐”的二元选择,没有分析评论文本的具体内容。最后价格分类也不完美,比如免费游戏的内购消费无法体现在初始价格中,也没有统计游戏的最低折扣价格。

没有纳入更多的变量是因为毕业论文只允许单独使用定量分析。坛友提到的游戏质量,汉化质量等等其实我在自己的phd proposal里是有考虑到的,但是需要引入访谈,问卷调查,对具体评论的语义分析等等方法,不是硕士毕业论文可以完成的任务量。如果有后来者打算在这方面深入研究,我这篇不完善的报告也算是抛砖引玉了

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

评分

参与人数 6战斗力 +7 收起 理由
Kaornao + 1
schneehertz + 2
thest + 1
Hammer28 + 1
ddlsyo + 1 好评加鹅
噗呸破屁诚 + 1 好评加鹅

查看全部评分

回复

使用道具 举报

     
发表于 2025-9-14 14:57 | 显示全部楼层
你为什么不研究一下游戏品质的问题呢
这样是不是更容易得出“差评多是因为它就应该差评多”的结论更简单一点?
回复

使用道具 举报

     
 楼主| 发表于 2025-9-14 15:07 | 显示全部楼层
王元姬无惨 发表于 2025-9-14 14:57
你为什么不研究一下游戏品质的问题呢
这样是不是更容易得出“差评多是因为它就应该差评多”的结论更简单一 ...

因为Steam API提供的数据无法客观量化“游戏品质”这个变量,“研究结果单纯基于对数据的定量分析,不包含任何定性数据”。我目的是验证上述两个假设。即使要加入这个变量,也不是我目前的能力和时间允许的事情。
回复

使用道具 举报

头像被屏蔽
     
发表于 2025-9-14 15:37 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2025-9-14 15:43 | 显示全部楼层
不谈游戏本身质量如何。。这。。。分析的有啥意义?
回复

使用道具 举报

     
发表于 2025-9-14 15:46 来自手机 | 显示全部楼层
分析部分还是简单了,我再提出几种可能,一,随着汉化的增多,很多以前看不懂(文本)的游戏现在能看懂了,玩家发现原来(剧情/文本)也不过是那么回事,甚至更容易发现(剧情/文本上的)缺点,从而降低了评价。二,随着汉化游戏的普及,汉化质量反而越来越参差不齐,降低了平均质量,自然也就降低了总体评价。
回复

使用道具 举报

     
发表于 2025-9-14 15:49 | 显示全部楼层
好游戏用了烂机翻

烂游戏用了好汉化

差评会咋样啊?
回复

使用道具 举报

发表于 2025-9-14 15:53 | 显示全部楼层
API提供的是外国人制作的有汉化的游戏,还是有中文的游戏。这条列清楚大家就对你这个研究心里有数了
回复

使用道具 举报

     
发表于 2025-9-14 15:54 | 显示全部楼层
感觉下次可以研究差评的关键词,比如优化差,内容少,价格贵,乳了等等
回复

使用道具 举报

     
发表于 2025-9-14 16:02 | 显示全部楼层
liuyigk 发表于 2025-9-14 15:53
API提供的是外国人制作的有汉化的游戏,还是有中文的游戏。这条列清楚大家就对你这个研究心里有数了 ...

有汉化的游戏和有中文的游戏区别在哪?
回复

使用道具 举报

     
发表于 2025-9-14 16:02 | 显示全部楼层
林无德 发表于 2025-9-14 15:49
好游戏用了烂机翻

烂游戏用了好汉化

前一个挺多,基本都是评价略降低

后一个~~~你能举个例子么,我是真想不出有烂游戏出神汉化的先例来
回复

使用道具 举报

     
 楼主| 发表于 2025-9-14 16:22 | 显示全部楼层
本帖最后由 gzGaryC 于 2025-9-14 16:31 编辑
alucardcz 发表于 2025-9-14 15:43
不谈游戏本身质量如何。。这。。。分析的有啥意义?

意义就是点明提供游戏中文本地化是吸引中国玩家的必要条件,但是对于购买了游戏的中国玩家,有没有中文本地化应该不会影响评论倾向。没有做得更深是因为系里给的研究时间跟对论文数据的要求都不允许,我是社科专业的。要做也得phd才做得到的事情了,但是phd做这个又不一定可行,不然不会2025年都搜不出几篇相关文献,大概业内会有内部研究报告吧
回复

使用道具 举报

     
 楼主| 发表于 2025-9-14 16:23 | 显示全部楼层
karastar 发表于 2025-9-14 16:02
有汉化的游戏和有中文的游戏区别在哪?

用外语制作的游戏(需要翻译成中文)跟用中文制作的游戏(需要外语本地化)
回复

使用道具 举报

     
发表于 2025-9-14 16:48 | 显示全部楼层
因为游戏质量这个东西本身就很难量化
量化是需要标准的,如果你要按照技术化的角度设定标准,显然会有很多人觉得标准偏颇。因为游戏评价本身高度跟“玩家主观倾向”相关,这种呼吁引入“质量”体系想法很好,但执行难度非常高。
一来是游戏属性的划分,二来是标准的锚定,这玩意我看再过30年也不见得能有完备的体系出来
回复

使用道具 举报

     
发表于 2025-9-14 16:55 来自手机 | 显示全部楼层
林无德 发表于 2025-9-14 15:49
好游戏用了烂机翻

烂游戏用了好汉化

1. 差评比例变多
2.差评数量变多

—— 来自 Xiaomi 25042PN24C, Android 15, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2025-9-14 17:34 | 显示全部楼层
好评差评有啥用,简体玩家切切实实买了1/3的销量
回复

使用道具 举报

     
 楼主| 发表于 2025-9-14 17:42 | 显示全部楼层
油条小贩 发表于 2025-9-14 17:34
好评差评有啥用,简体玩家切切实实买了1/3的销量

正是因为Steam没有官方渠道提供每个游戏的具体销量,所以只能用评论量来量化中国玩家的购买量
回复

使用道具 举报

     
发表于 2025-9-15 11:55 | 显示全部楼层
对于2020年后的游戏,简体中文玩家的评论倾向明显更负面。2022到2025年这个趋势急剧恶化。

感觉这正好是国内经济下行期啊。感觉挺无力的,变量太多了没法控制。
回复

使用道具 举报

     
发表于 2025-9-15 12:07 | 显示全部楼层
会有**发行觉得好评比销量还重要吗
回复

使用道具 举报

     
 楼主| 发表于 2025-9-15 13:20 | 显示全部楼层
Hinanya 发表于 2025-9-15 11:55
感觉这正好是国内经济下行期啊。感觉挺无力的,变量太多了没法控制。

比较可行的方案是找一些中英好评分化严重的比较有代表性的热门游戏。做一些问卷或者访谈再结合Steam评论具体内容做分析
回复

使用道具 举报

     
发表于 2025-9-15 13:34 来自手机 | 显示全部楼层
gzGaryC 发表于 2025-9-15 13:20
比较可行的方案是找一些中英好评分化严重的比较有代表性的热门游戏。做一些问卷或者访谈再结合Steam评论 ...

能不能通过和同期英语评价的好评率变化来做对比呢
回复

使用道具 举报

     
发表于 2025-9-15 13:43 来自手机 | 显示全部楼层
还算符合直觉吧。中文是相当一部分玩家购买的前提条件,只作用于购买决策时,而不作用于游玩过程中。

数据也驳斥了中文玩家经常因为语言而刷差评的说法,非中文游戏的中文差评率并不升高。

—— 来自 Xiaomi 24129PN74C, Android 15, 鹅球 v3.5.99
回复

使用道具 举报

     
 楼主| 发表于 2025-9-15 13:48 | 显示全部楼层
karastar 发表于 2025-9-15 13:34
能不能通过和同期英语评价的好评率变化来做对比呢

应该可以实现,API可以提供每条评论的详细信息,包括精确的时间戳,通过这个来计算好评率变化,但是成本高;还有一个是按月分组的正面和负面评论统计数据,成本低很多但是精度差(存疑)。不通过API直接从Steam商店页面爬相关内容应该也是可行的
回复

使用道具 举报

发表于 2025-9-15 13:57 来自手机 | 显示全部楼层
本帖最后由 wbtsy 于 2025-9-15 14:17 编辑

你这个研究的结论问题很大啊。
别的先不说,什么叫“真正影响游戏评价的是发售时间”?你的分析只能说是有相关性,怎么证明因果的?

你最多只能说相对差评率和时间呈现相关性。但是具体原因可能是你没有调查的东西,比如每位玩家玩过的游戏数量、类型、厂商营销量等等,这些可能恰好和和时间共同变化的因素引起的。

探索性数据分析大多数情况下只能给出基本信息,真正要搞出好的分析,要不就是做问卷,要不就是一条一条读评论然后进行分析。用表面的数据能分析出的内容很有限,只能事必躬亲。

不然那些二游大厂也不会发问卷+聘那么多985和海龟博士来分析数据了。
回复

使用道具 举报

     
 楼主| 发表于 2025-9-15 14:44 | 显示全部楼层
本帖最后由 gzGaryC 于 2025-9-15 14:53 编辑
wbtsy 发表于 2025-9-15 13:57
你这个研究的结论问题很大啊。
别的先不说,什么叫“真正影响游戏评价的是发售时间”?你的分析只能说是有 ...

你说的点我在研究过程中都考虑到了,全文都没有使用causation这个词。我的研究目的只是验证假设1跟假设2,而发行时间跟好评率的关联只是作为一个意外发现提出来。我当然知道研究方法有很多不足之处,不过为了坛友阅读方便没有全搬上来。

前面也说了硕士项目没有办法结合定性和定量分析,二选一做了定量。而且定量数据分析规定只能基于现存的二手数据集(Secondary dataset),我从Steam API拉数据已经是打擦边球,几个月时间下来我只能做到现在这样。
回复

使用道具 举报

发表于 2025-9-15 14:56 | 显示全部楼层
可能是你写得太简略了,你这个根据时间的结论,我有一点小小的问题:
你的研究中提到:
真正影响评价差异的是游戏发售时间。对于2020年后的游戏,简体中文玩家的评论倾向明显更负面。2022到2025年这个趋势急剧恶化。时间因素的影响力远远超过了汉化本身。

这里你提到了2020年,众所周知疫情导致玩家群体经历了一波膨胀期。所以结合你这里发现的差评变多的趋势,请问你说的变多指的是:
a. 绝对数量变多(中文steam玩家基数变大)还是 b. 相对比例更多(中文steam玩家更爱给差评了) ←根据我对你的研究的理解,你说的是后者
针对新增玩家这个变量,其实可以继续延伸:
是这部分“新增玩家”导致的差评增加吗?还是说,“中文玩家整体变得更苛刻了”?  ←根据我对你的研究的理解,你说的是后者
与英文玩家评论的对比其实也可以考虑一下这个问题,因为可能不是“中文玩家变苛刻”了,而是“英文玩家变宽容了”😂

你这研究还是挺有现实意义的,也符合现在本地化数量增多但质量层次不齐的情况。也算抛砖引玉吧,感觉很适合那些发行机构去研究一下的。
回复

使用道具 举报

     
 楼主| 发表于 2025-9-15 15:01 | 显示全部楼层
whi7sper 发表于 2025-9-15 14:56
可能是你写得太简略了,你这个根据时间的结论,我有一点小小的问题:
你的研究中提到:
这里你提到了2020年 ...

是后者没错,做回归分析之前我应该有对比总体评价变化趋势的。对新增玩家的分析之前没有考虑过,确实是一个着手点
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-10-11 05:00 , Processed in 0.391263 second(s), 8 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表