找回密码
 立即注册
搜索
查看: 3253|回复: 31

[科技] 春节期间尝试了一下AI翻译字幕功能,确实比较好用

[复制链接]
     
发表于 2026-2-26 08:44 | 显示全部楼层 |阅读模式
春节期间想看一部纪录片《反对Putin的无名先生》,但是此片比较小众,豆瓣上打分人数不到500,字幕库上也没有人做单独的中文外挂字幕。片子的主要对白和画外音都是俄语,片源有英语硬字幕,直接生啃难度其实也不大。B站虽然能找到澳门卡西诺赞助字幕组发布的熟肉版,但看了一会儿就发现字幕可能是用OCR识别软件或者听译软件扒出字幕文本,然后丢给AI直接跑出来的,质量不太满意。

于是索性自己试着用AI工具翻译,但是此片由于是内嵌英文硬字幕,并没有找到单独的英文SRT或ASS格式文本,最后只是找到了一个捷克语版的SRT文本,虽然这个文本大概率是从英文翻译过来的而不是直接听译片源得来的,但是有总胜过无,毕竟这样就可以直接使用AI工具翻译了,正好也可以测试一下AI工具的小语种翻译水平。

片子的SRT文本里一共有791条字幕,考虑到AI工具单次处理文本有大小限制,所以每次扒出100条喂给AI,前半部分使用的是GEMINI,后半部分使用的是GPT,使用的都是免费模型。在开始翻译前,为了提高翻译质量,首先参考IMDB、维基、豆瓣上的影片基本信息和背景资料,编写一段提示词,介绍影片的主要背景——有关俄乌战争期间的俄罗斯普通人生活,故事发生在乌拉尔山区名叫卡拉巴什的矿业小镇。

将AI翻译生成的中文文本替换掉SRT文件里原来的捷克语文本,时间轴不变。然后外挂观看,对照片源英文硬字幕评估翻译质量,总体翻译质量明显高出卡西诺字幕组不少,没有感觉到太明显的机翻味,和英文文本的意思基本吻合。而且有意思的是,在使用GEMINI进行翻译的时候,每100条字幕翻译完毕后,GEMINI还会对当前翻译文本大意进行概括,甚至还能对其中的细节进行特地标明,譬如说片中提到了一个俄乌战场前线的地名阿尔乔莫夫斯克,GEMINI特别注明这就是巴赫穆特,这个信息对我来说确实是第一次知道。

当然,翻译也不是完美无缺。整个791条字幕翻译下来,有1处AI在生成的时间轴上和我丢给它的不符,往后加了1分钟,结果导致后面的字幕无法正常显示,需要手动调节时间轴文本。还有1处,是漏翻了2条文本。AI对此的反馈是,一次能处理的文本量有限,如果能每次少量丢给它,多次完成,可能就不会出现这样的低级错误。但我怀疑,如果真的是一部字幕文本量巨大的片子,免费AI模型又可能会遇到上下文记忆错乱的问题,有可能还是会影响翻译质量。

不过,我对这次尝试还是比较满意的,也算是提供了一个AI使用的新思路:以前有很多经典小众的小语种片子,因为没有好的翻译字幕,造成观影体验不佳或者直接就错过了,虽然近年来越来越多外语片的字幕翻译质量已经提升很多了,但总归还是有漏网之鱼,尤其是对于俄语、波兰语、土耳其语、阿拉伯语这些小语种,目前很多片子的中文字幕都是通过英翻转译成中文的,翻译腔非常浓重。但现在,理论上来说,完全可以尝试找相应片子的原生语言外挂字幕(譬如针对一部苏联电影,找相应的俄语外挂字幕),然后在提供必要的背景信息后由AI进行精翻,效果未必差于低质量的熟肉。

评分

参与人数 2战斗力 +2 收起 理由
花小楼 + 1 好评加鹅
mycNo1 + 1

查看全部评分

回复

使用道具 举报

     
发表于 2026-2-26 08:47 | 显示全部楼层
之前在南+有大佬做了ASMR字幕的AI傻瓜工具。
真好用啊真好用
回复

使用道具 举报

     
发表于 2026-2-26 08:48 | 显示全部楼层
试过用potplayer的ai实时生成字幕,连入deepseek自动翻译,短片效果不错,长片估计除了慢点也没啥问题
回复

使用道具 举报

     
发表于 2026-2-26 08:59 | 显示全部楼层
语言翻译算是llm最擅长的场景之一了, 输入和输出完全匹配. 一部片子的文本量其实对现在的模型来说处理起来问题不会很大, 何况还可以对上下**总结压缩呢

说起来我记得好像说视频网站像**的翻译, 居然都没用自家的gemini....也是有点神奇
回复

使用道具 举报

     
发表于 2026-2-26 09:01 | 显示全部楼层
现在ai字幕真挺多的,联系上下文的能力还差点
回复

使用道具 举报

     
发表于 2026-2-26 09:19 | 显示全部楼层
ai字幕确实不错,现在哪怕是那种实时翻译的字幕做的都不错了。有现成的文本翻译的质量只会更好
回复

使用道具 举报

     
发表于 2026-2-26 09:19 | 显示全部楼层
现在噶啦给母都快变成新出一部立刻有ai汉化补丁跟上了
回复

使用道具 举报

     
发表于 2026-2-26 09:25 | 显示全部楼层
你这有英文硬字幕还能找到SRT处理起来不算麻烦了,试过八国联军语音拿whisper无脑转写出的SRT也凑合能用,翻译以前用DS V3现在用GLM5体验还行。毛子片的资源主要恶心在可能会有“同声翻译”混在一起,这个还没找到啥好方案
回复

使用道具 举报

     
发表于 2026-2-26 09:29 来自手机 | 显示全部楼层
naclken. 发表于 2026-2-26 08:47
之前在南+有大佬做了ASMR字幕的AI傻瓜工具。
真好用啊真好用

有地址吗

—— 来自 Xiaomi 23127PN0CC, Android 16, 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-2-26 09:30 | 显示全部楼层
说起来我最近试了下用llm+nanobanana汉化本子 感觉效果还挺好的..
搜了下泥潭之前好像也有个讨论帖 可惜帖子已经关了...
[漫画汉化组的时代是不是结束了](https://stage1st.com/2b/forum.php?mod=viewthread&tid=2271496)
回复

使用道具 举报

     
发表于 2026-2-26 09:36 | 显示全部楼层
我过年也干了类似的事。那个英文字幕有800多条,我直接把srt扩展名改成txt,当成附件上传给DeepSeek,告诉它一些注意事项,尤其是时间轴不要错位,让它翻。上下文长度其实是够的,输出长度不够,我让它自己看情况分段处理。它自己就每次吐200条的翻译给我,告诉我如果没问题就回复它“继续”。分了4次吐给我,我直接粘贴到txt里,改了扩展名拿去用了,好像没啥大问题。我提要求的时候还忘了让它处理一下标点符号,句末的句号什么的还是有点奇怪,如果先提好标点符号的要求,效果应该会更好一些。




本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
发表于 2026-2-27 23:13 | 显示全部楼层
0WHan0 发表于 2026-2-26 09:29
有地址吗

—— 来自 Xiaomi 23127PN0CC, Android 16, 鹅球 v3.5.99

tid-2690727

评分

参与人数 2战斗力 +2 收起 理由
0WHan0 + 1
schneehertz + 1

查看全部评分

回复

使用道具 举报

     
发表于 2026-2-28 00:33 | 显示全部楼层
我春节直接拿AI看国外同人小说,翻译质量杠杠的,该煽情煽情该接地气接地气,甚至还给我按章节总结
回复

使用道具 举报

     
发表于 2026-2-28 00:53 来自手机 | 显示全部楼层
有什么自带提取词汇表,然后开始翻译的工作流吗

—— 来自 鹅球 v3.5.99
回复

使用道具 举报

     
发表于 2026-2-28 01:23 来自手机 | 显示全部楼层
上次想看(赛博斯拉夫,下的文件自带英文软字幕,抽出英文字幕d老师翻译后外挂看还不错,d老师还会把开头的圣咏翻译成诗歌体,看完了还能跟d老师讨论剧情...
没有字幕可以先用whisper生成字幕。
回复

使用道具 举报

     
发表于 2026-2-28 04:43 | 显示全部楼层
安利个国产免费的ai工具,一键翻译并输出字幕文件,我跑了很多没字幕的小电影

https://v.flashai.com.cn/
回复

使用道具 举报

发表于 2026-2-28 07:21 来自手机 | 显示全部楼层
有没有实时AI加翻译字幕的工具呢
回复

使用道具 举报

     
发表于 2026-2-28 07:31 | 显示全部楼层
又没有精确的打轴器?给MV做字幕用,歌词已经有了。
多模态LLM每次弄完的精确度不够需要微调,问大模型被告知让我手动在aegissub里自己搞
回复

使用道具 举报

     
发表于 2026-2-28 07:58 来自手机 | 显示全部楼层
勿徊哉 发表于 2026-2-28 07:31
又没有精确的打轴器?给MV做字幕用,歌词已经有了。
多模态LLM每次弄完的精确度不够需要微调,问大模型被告 ...

那没办法,如果入点出点都对不上只能手搓,而且有的时候想和画面对齐入点也得自己凹
简单的闪轴问题是可以用aeg的自带工具一口气秒掉的

—— 来自 鹅球 v3.5.99
回复

使用道具 举报

发表于 2026-2-28 08:03 | 显示全部楼层
harmonytree 发表于 2026-2-26 08:48
试过用potplayer的ai实时生成字幕,连入deepseek自动翻译,短片效果不错,长片估计除了慢点也没啥问题 ...

这个有教程么要自己搭东西么?
回复

使用道具 举报

     
发表于 2026-2-28 08:23 | 显示全部楼层
你们s1的电影大把ai破解汉化
回复

使用道具 举报

     
发表于 2026-2-28 08:25 来自手机 | 显示全部楼层
上帝的爪子 发表于 2026-2-28 07:21
有没有实时AI加翻译字幕的工具呢

有啊,potplayer接口就有大模型实时翻译,就是消耗比较大。
回复

使用道具 举报

     
发表于 2026-2-28 08:25 | 显示全部楼层
本贴坛友的各类需求在AI创世纪时代已经有大佬用python实现整过一波了:
https://github.com/YaoFANGUK

基本就是他项目里的几类需求,当时还没有多模态
如今大模型质量天差地别,完全可以找龙虾、CC、反重力clone下来改成自己的工作流

回复

使用道具 举报

     
发表于 2026-2-28 08:31 | 显示全部楼层
勿徊哉 发表于 2026-2-28 07:31
又没有精确的打轴器?给MV做字幕用,歌词已经有了。
多模态LLM每次弄完的精确度不够需要微调,问大模型被告 ...

MV没试过,但是几年前开始字幕组不都普遍使用Arctime了吗?
现在也有不少开源方案,比如
https://www.bilibili.com/opus/1066301630699274272
还有个刚搜到的
https://github.com/aitranslate/AlignX
回复

使用道具 举报

     
发表于 2026-2-28 08:44 来自手机 | 显示全部楼层
本来想单独开贴的,还是回复好了。
以现在的流行度没必要拿字幕搞。如果是常用语言的比如英语,有工具非常好用了。
我刚批量化流程烤肉烤了165个纯英文教程自用。
不需要提供字幕。

首先是视频下载(用低清就行了),然后扒音轨带通滤波人声降噪,利用大模型ASR出文本,自动打轴。(转录)
然后给翻译模型,告诉他限定范围,如果是电影的话跟他说限定类型和翻译要求会准确很多,还有一些固有名词提供可以限定不翻译。
除了台本翻译还能够自动校对调整前面打轴分段不够合理的地方。
翻译质量看你调教,我的因为是教程所以白话准确不需要什么再加工多高语文用典水平还简单得多。
输出ass挂上去。

嫌麻烦的可以用「卡卡字幕助手」,有提供公益免费转录接口(次数和长度限制)或者本地大模型cuda转录(听译文本智能不如联网大模型)fast-whisper,后面的就用其他大模型api校对文本字幕格式什么的一套搞定。
回复

使用道具 举报

     
发表于 2026-2-28 08:45 | 显示全部楼层
lupin1984t 发表于 2026-2-28 08:03
这个有教程么要自己搭东西么?

【看剧不怕没字幕,PotPlayer如何AI生成字幕】 https://www.bilibili.com/video/B ... ffdfd55891034659053
【PotPlayer+DeepSeek自动识别翻译字幕 老司机骚操作拯救无字片库】 https://www.bilibili.com/video/B ... ffdfd55891034659053

照着教程来应该没问题,需要自己下载模型,翻译的话可能需要折腾一下,我是买的deepseek
回复

使用道具 举报

     
发表于 2026-2-28 08:53 | 显示全部楼层
顺便如果有搬运需求,可以参考这个全自动化的**-B站项目
https://github.com/difyz9/ytb2bili

B站有相当多的搬运账号搞了这套流程,部分工作流完全可以截取下来自用
回复

使用道具 举报

     
发表于 2026-2-28 08:58 | 显示全部楼层
在codex或者claude code上查询有没有类似的skills,没有的话,通过自然语言让ai自己创建这样一个skills,然后测试修改多来几次就能用了,很好用
回复

使用道具 举报

     
发表于 2026-2-28 09:00 | 显示全部楼层
海豹墨鱼卷 发表于 2026-2-28 08:44
本来想单独开贴的,还是回复好了。
以现在的流行度没必要拿字幕搞。如果是常用语言的比如英语,有工具非常 ...

上个月阿里开源了 Qwen3-ASR ,中文和粤语识别也不成问题了,我用demo测粤语歌非常准

关键是小,1.7B差不多手机都能搞了,还支持流式输出,wisper本地跑起来没问题但还是太重
回复

使用道具 举报

     
发表于 2026-2-28 09:02 | 显示全部楼层
b站那个什么斑马



应该是实现全自动化翻译加中配了



一天搬外网几十上百个高人气科普视频



还被洋人发视频挂来批判了



网友说你这个批判视频人气再高点,就要被斑马搬过来了
回复

使用道具 举报

     
发表于 2026-2-28 09:12 | 显示全部楼层

这个100%是用我刚发的项目做的,标题味儿都一样,不含任何人类成分
回复

使用道具 举报

     
发表于 2026-3-1 12:50 | 显示全部楼层
勿徊哉 发表于 2026-2-28 07:31
又没有精确的打轴器?给MV做字幕用,歌词已经有了。
多模态LLM每次弄完的精确度不够需要微调,问大模型被告 ...

目前看到测试结果 qwen-asr 打轴很准 可以达到人工轴的水平
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2026-6-25 07:34 , Processed in 0.177372 second(s), 11 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表