本帖最后由 gzGaryC 于 2025-9-15 15:15 编辑
前情提要:https://stage1st.com/2b/thread-2248659-1-1.html
特别鸣谢:steam游戏中文及中文评论概况统计(ver.2024.11) frankCC坛友提供的灵感
楼主在今年年初发过帖子询问坛友对中文游戏本地化的看法和评论习惯。最近完成了一篇关于游戏中文本地化对Steam简体中文玩家影响的社科专业硕士论文,想和大家分享一些有意思的发现。研究结果单纯基于对数据的定量分析,不包含任何定性数据(比如评论的具体内容)。
研究背景这几年越来越多游戏提供中文支持,但中国玩家的差评却越来越多。2024年简体中文已经成为Steam第一大语言,占到了33.7%,超过了英文,是汉化游戏的增加没让没让中国玩家更满意,还是另有其因? 为了搞清楚这个问题,我收集了8797款Steam游戏的数据,这些游戏都是2010到2025年间发布的,每款至少有100条评论,且简体中文和英文评论数不少于20条,DLC等非游戏内容在数据收集过程中已被排除。通过Steam API和对商店页面爬虫获取了游戏信息、价格、评论数据、标签等各种信息。数据收集截止时间为2025年的6月中旬。Steam API只能提供游戏对某种语言的支持的数据,比如某游戏对英文有文本和语音支持,对中文只有文本支持。也许可以通过开发商或者发行商的名字区分是否为本土开发者,但是我没想到特别好的实践方法。
这里假设绝大多数中国玩家都会用母语(简体中文)留评论,因此用简体中文的评论数据来代表Steam平台上的中国玩家,数据分析不涉及繁体中文评论。游戏价格为数据收集时的游戏全价。游戏标签采用因子分析的形式降低复杂度,生成20个独特的品类加入到回归分析中,这20个品类可以覆盖样本里50%的游戏。
我的两个研究假设假设1:汉化程度越高,从无汉化到文本汉化再到文本+语音汉化,中国玩家的参与度会越高。我用简体中文评论占总评论的比例来衡量参与度。这里使用Beta回归。 假设2:汉化程度越高,中国玩家相对于一款游戏的评价会更积极。 使用Steam上评论占比最多的英文评论(抽象理解为其他地区的玩家)作为对照,我用中文好评率(推荐率)减去英文好评率的差值来衡量,负值说明中国玩家评论相较英文评论更加负面。因为OLS模型的异方差性,这里使用WLS。
主要发现假设1得到强烈支持汉化确实能显著提高中国玩家参与度。文本+语音汉化能让中国玩家评论的可能性提高129%,OR值达到2.29。仅有文本汉化也能提高102%,OR值为2.02。这些结果的p值都小于0.001,统计显著性极高。 不同类型游戏的效果还不一样。文字密集型游戏比如视觉小说和剧情向游戏,汉化的正面效果能额外加成35%;对于独立游戏(带Indie标签),汉化效果能加成21%;售价50元以下的低价游戏(不包括免费游戏),汉化带来的参与度提升最明显。
假设2没有得到支持汉化并不能改善中国玩家对于一款游戏的相对评价。全汉化对评价几乎无影响,系数接近0。文本汉化虽然统计显著,但实际效果微乎其微,系数仅有0.01。 回归模型里真正影响评价差异的是游戏发售时间。对于2020年后的游戏,简体中文玩家的评论倾向相对于写英文评论玩家明显更负面。2022到2025年这个趋势急剧恶化。时间因素的影响力远远超过了汉化本身。
一些有趣的细节中国玩家的游戏偏好通过分析发现中国玩家对某些游戏品类的参与度明显更高,包括赛车模拟器、视觉小说、第三人称潜行、格斗游戏和2D平台跳跃游戏。 价格与汉化的微妙关系3A大作,也就是200元以上的游戏,汉化已经是标配,能缓解7%的负面评价。但中等价位(120到200元)的游戏,全汉化反而可能招致更多批评。独立游戏如果只做文本汉化,评价反而会下降2%。 时间趋势的深层含义一种可能的解释是中国玩家群体经历了多年高质量民间汉化的熏陶,形成了独特的"汉化品味"。当官方汉化质量达不到期待时,反而会引发更强烈的批评。
另外,中国玩家使用Steam评论的方式可能有别于其他地区的用户,这种批判性评论也成为了展示游戏品味的一种方式。 研究局限我的研究有几个局限性。首先我假设所有人用母语评论,评论语言占比不能简单与购买游戏的玩家使用的语言对齐(比如we need chinese属于英文评论);实际上双语玩家更可能会策略性地选择评论语言(上次小问卷就有坛友提到更喜欢用英语评论)。其次无法追踪民间汉化的影响,很多老游戏其实有汉化组补丁,但数据上显示为"无汉化"。另外我仅分析了Steam评价的“推荐”或“不推荐”的二元选择,没有分析评论文本的具体内容。最后价格分类也不完美,比如免费游戏的内购消费无法体现在初始价格中,也没有统计游戏的最低折扣价格。
没有纳入更多的变量是因为毕业论文只允许单独使用定量分析。坛友提到的游戏质量,汉化质量等等其实我在自己的phd proposal里是有考虑到的,但是需要引入访谈,问卷调查,对具体评论的语义分析等等方法,不是硕士毕业论文可以完成的任务量。如果有后来者打算在这方面深入研究,我这篇不完善的报告也算是抛砖引玉了
|