找回密码
 立即注册
搜索
楼主: julytc

[科技] deepseek v4 翻译小说使用感受

[复制链接]
     
 楼主| 发表于 2026-4-26 01:25 | 显示全部楼层
qwjhb 发表于 2026-4-25 11:59
notebooklm有个问题是注意力太集中在前半段,如果生本书扔进去术语表可能主要是前几章的
我先说的做法是not ...

我是先生成一个小术语表 统一人称 关键概念词 地名等这些术语 然后将生成的术语表和小说txt 扔进aistuido 用专门的关键词在提取一遍,notebooklm直接提取的话问了几轮后的确会出现重复回答的情况
回复

使用道具 举报

     
发表于 2026-4-26 08:45 | 显示全部楼层
我正好相反,需要把自己写的中文小说翻成日文
回复

使用道具 举报

发表于 2026-4-26 11:15 | 显示全部楼层
julytc 发表于 2026-4-26 01:25
我是先生成一个小术语表 统一人称 关键概念词 地名等这些术语 然后将生成的术语表和小说txt 扔进aistuido ...

那效果应该差不多,我现在的做法就是有点费token
每批文本都要经过 术语提取 翻译 总结 三**模型调用
先在上下文大了 我可以试试一次整章翻译 可能效果会好点

另外你有处理术语人名的变体吗?我碰到原文用了人名的昵称,但是被大模型识别出全名是在术语表里出现过,然后昵称就被翻译成了全名状态,导致文中好好说话的地方有时候会变成“你妈叫你全名”的感觉
回复

使用道具 举报

     
发表于 2026-4-26 11:19 | 显示全部楼层
花咲茜 发表于 2026-4-26 08:45
我正好相反,需要把自己写的中文小说翻成日文

claudecode然后挂个ds的api用脚本接进去然后润色下效果最好,其他的都翻译腔
回复

使用道具 举报

     
 楼主| 发表于 2026-4-26 15:19 | 显示全部楼层
qwjhb 发表于 2026-4-26 11:15
那效果应该差不多,我现在的做法就是有点费token
每批文本都要经过 术语提取 翻译 总结 三**模型调用
先 ...

我的方法比较笨 人名分为三部分 姓 名 全名各一个术语表 昵称也建立一个条目 这样比较容易缓解这种问题
回复

使用道具 举报

     
发表于 2026-4-26 15:45 | 显示全部楼层
老哥,把这个帖子的关闭时间看看能不能关掉或者延长点,不然一个月就看不了太惨了。
回复

使用道具 举报

发表于 2026-4-26 15:56 来自手机 | 显示全部楼层
julytc 发表于 2026-4-26 15:19
我的方法比较笨 人名分为三部分 姓 名 全名各一个术语表 昵称也建立一个条目 这样比较容易缓解这种问题 ...

看来还是得设计术语表,还好英文昵称比较固定可以通过全名预测出来。
毕竟大模型翻译不是cat 看看要么重新设计下术语表,
比如设计个角色信息 把名字、昵称指向角色 大模型应该能理解。

—— 来自 Xiaomi 2512BPNDAC, Android 16, 鹅球 v3.5.99
回复

使用道具 举报

     
 楼主| 发表于 2026-4-26 16:41 | 显示全部楼层
qwjhb 发表于 2026-4-26 15:56
看来还是得设计术语表,还好英文昵称比较固定可以通过全名预测出来。
毕竟大模型翻译不是cat 看看要么重 ...

这是我用的提取人名术语表的关键词 希望对你有用 前者用在notebooklm生成小术语表 后者用在aistuido生成完整术语表
生成一份书中人名和其昵称的术语表 要全,按照全文风格,时代气氛,以及角色阶级,年龄进行翻译,不要出现前面是小姐后面是女士的情况,并以以下json格式输出
{
"src": "原文",
"dst": "翻译",
"info": ""
},info的内容保持为空,


# 【角色设定】
你现在是一位**出版级英中文学翻译专家、犯罪文学研究者以及语言学术语工程师**。
你具备以下能力:
* 英美推理小说翻译经验
* 刑侦、法医与法律术语识别能力
* 文学翻译术语标准化经验
* 专业术语库构建经验
你的任务不是简单提取词汇,而是建立一套**可用于整本小说翻译的标准化术语库(Glossary)**。
该术语库必须:
* 译名统一
* 术语精确
* 分类清晰
* 可长期复用
---
# 【任务目标】
请完整阅读我提供的**英文小说文本**。
在理解文本语境的基础上,提取所有**对翻译项目具有术语价值的词汇或表达**,并构建一个:
**英中推理小说翻译术语表(Glossary)**
该术语表将用于:
* 统一翻译
* 防止译名混乱
* 保证推理逻辑准确
---
# 【术语提取体系(核心模块)】
术语必须按以下逻辑进行识别。
---
# 一、实体名称体系(Named Entity System)
## 人名(Person)
必须拆分为三种形式:
* First Name
* Last Name
* Full Name
例如:
Arthur
Holmes
Sherlock Holmes
---
## 地名(Location)
包括:
* 国家
* 城市
* 街道
* 房屋
* 建筑
例如:
* Baker Street
* Whitehall
---
## 机构名称(Organization)
包括:
* 警察机构
* 政府机构
* 法院
* 医院
* 大学
* 公司
例如:
* Scotland Yard
* Metropolitan Police
---
# 二、案件与事件体系(Case & Event)
提取所有案件或事件名称,例如:
* The Locked Room Murder
* The Baker Street Murders
---
# 三、推理结构术语(Mystery Structure Terminology)
必须重点识别以下结构词:
* alibi
* motive
* suspect
* witness
* red herring
* timeline
---
# 四、推理诡计分类(Trick Taxonomy)
识别推理小说中的诡计术语,例如:
* locked-room trick
* time-shift trick
* body substitution
* alibi trick
* impossible crime
---
# 五、刑侦流程术语(Investigation Workflow)
识别侦查过程中的专业词汇,例如:
* interrogation
* surveillance
* search warrant
* evidence collection
---
# 六、证物本体分类(Evidence Ontology)
重点提取与案件证据相关的术语,例如:
* fingerprint
* bloodstain
* footprint
* bullet
---
# 七、法医术语(Forensic Terminology)
包括:
* autopsy
* toxicology
* rigor mortis
* livor mortis
---
# 八、法律术语(Legal Terminology)
包括:
* indictment
* testimony
* cross-examination
* jury
---
# 九、犯罪工具(Weapons)
例如:
* revolver
* dagger
* poison
* cyanide
---
# 十、人物称谓体系(Address System)
提取人物社会称谓,例如:
* Mr.
* Mrs.
* Dr.
* Professor
* Inspector
---
# 十一、文化语言表达(Cultural Expressions)
提取需要本地化处理的语言,例如:
* 英语俚语
* 警察行话
* 黑帮俚语
例如:
* perp
* snitch
* stakeout
---
# 【严格排除规则】
极其重要:
如果某个英文词汇:
* 在中文中已有**稳定固定译法**
* 且不存在翻译歧义
则不要列入术语表。
例如:
* police
* door
* car
这些普通词汇必须排除。
术语表只保留:
* 专业术语
* 推理结构词
* 关键剧情术语
* 需要统一译名的词汇
---
# 【译名选择规则】
当某个词存在多个译法时:
必须选择:
**最通行、最符合中国读者习惯的译名**
避免:
* 生造翻译
* 不常见译法
---
# 【输出格式】
请严格使用以下 JSON 格式输出。
不要输出任何解释。
每个术语单独一条。
info 字段保持为空。
格式如下:
JSON
{
"src": "原文",
"dst": "翻译",
"info": ""
},
---
# 【提取优先级】
术语提取必须遵循以下优先级:
最高优先级:
1 推理结构术语
2 推理诡计术语
第二优先级:
3 证物术语
4 刑侦流程术语
第三优先级:
5 法医术语
6 法律术语
第四优先级:
7 人名
8 地名
9 机构名
---
# 【最终目标】
生成一份**出版级英中推理小说术语库**。
该术语库必须:
* 译名统一
* 分类完整
* 可用于整本小说翻译项目

评分

参与人数 6战斗力 +9 收起 理由
秦南心 + 2
绝地潜兵 + 1 大师
别里科夫 + 2
zerona + 1 这太牛了
qwjhb + 1 好评加鹅
明明有雨 + 2 好评加鹅

查看全部评分

回复

使用道具 举报

     
发表于 2026-4-26 16:50 | 显示全部楼层
jojog 发表于 2026-4-26 11:19
claudecode然后挂个ds的api用脚本接进去然后润色下效果最好,其他的都翻译腔 ...

初翻26万字,结果发现汉字太TM多了,一些平时都不会用汉字表记的词也都写成汉字了,吁,还得手动改
回复

使用道具 举报

     
发表于 2026-4-26 21:03 | 显示全部楼层
我有本英文小说现在还在软件里边看边翻,没把握的句子看一眼ai的结果。有老翻译说做翻译掺了ai文本,整个文本看着就不会好。楼主你怎么看?
回复

使用道具 举报

     
发表于 2026-4-26 21:47 | 显示全部楼层
可以换换LinguaGacha再跑一遍,是不同运行思路的同类软件
回复

使用道具 举报

     
发表于 2026-4-26 21:51 | 显示全部楼层
感谢分享。
回复

使用道具 举报

     
发表于 2026-4-26 22:32 来自手机 | 显示全部楼层
qwjhb 发表于 2026-4-25 11:59
notebooklm有个问题是注意力太集中在前半段,如果生本书扔进去术语表可能主要是前几章的
我先说的做法是not ...

你是直接用这个翻译不走ainiee吗?
回复

使用道具 举报

     
发表于 2026-4-26 22:33 来自手机 | 显示全部楼层
qwjhb 发表于 2026-4-26 11:15
那效果应该差不多,我现在的做法就是有点费token
每批文本都要经过 术语提取 翻译 总结 三**模型调用
先 ...

俄文小说这问题太严重了,每个人都n个名字,昵称还老重名
回复

使用道具 举报

     
 楼主| 发表于 2026-4-26 22:34 | 显示全部楼层
别里科夫 发表于 2026-4-26 21:03
我有本英文小说现在还在软件里边看边翻,没把握的句子看一眼ai的结果。有老翻译说做翻译掺了ai文本,整个文 ...

ai的确存在幻觉,有些遣词造句的确存在人机味道 但这个可以通过模型的进步和关键词的设定解决。如果你使用可以连接上下文的软件或者直接用web端生成翻译 自己对照原文进行修改 然后在喂给ai 让它拿你的译文和他生成的结果进行对比 为下面的翻译定下准则 几轮对话下来基本就可以让ai按照你的文风进行翻译(当然 人工审核依旧是不可缺少的),甚至你可以使用多个ai进行交叉校对。以免自己的翻译思路被一种ai定死。当然如果你是自己看 没必要那么麻烦。
总体而言 出版社拒绝ai有点跟画师或程序员最初继续ai的感觉一样。毕竟在世界知识 翻译需要的词法和语法方面 ai是绝对优势。只是受限于机能和上下文性能目前还很难做到有人味儿罢了
回复

使用道具 举报

     
发表于 2026-4-26 22:37 | 显示全部楼层
我看他打折到5月5号,感觉1块钱至少可以翻译3本小黄本
回复

使用道具 举报

发表于 2026-4-27 00:11 来自手机 | 显示全部楼层
alacab 发表于 2026-4-26 22:32
你是直接用这个翻译不走ainiee吗?

我自己写代码的
之前都不知道ainiee这个东西

—— 来自 Xiaomi 2512BPNDAC, Android 16, 鹅球 v3.5.99
回复

使用道具 举报

发表于 2026-5-2 11:21 | 显示全部楼层
本帖最后由 qwjhb 于 2026-5-2 12:58 编辑

我这次拿v4 pro翻译了一系列3本小说,改了改术语表的逻辑。
毕竟大模型不是cat软件,术语表好像信息太少,现在是变成了知识库概念。也还是先从notebooklm获取基础的

请分析以下电子书,为其生成一个翻译用的语义知识库,格式为 JSON。

书名:BOX - Neural Wraith 1 - 3
作者:K. D. Robertson

请提取以下内容:

1. characters(人物):
   - 全名及对应中文译名
   - 昵称/简称及对应中文译名(注意:昵称应对应同一个中文称呼)
   - 角色定位(主角/配角/反派)
   - 性格特征
   - 主要人物关系
   - 说话风格(正式/随意/幽默/严肃等)

2. places(地点):
   - 地名及中文译名
   - 简要描述

3. concepts(概念/专有术语):
   - 原文及中文译名
   - 简要说明

4. world_setting(世界观/时代背景):
   - time_period: 时代
   - culture: 文化背景
   - tech_level: 科技水平(如适用)
   - social_structure: 社会结构
   - translation_note: 整体翻译风格建议

5. cultural_strategy(文化处理策略):
   - idioms: 习语/成语处理方式
   - measurements: 度量衡处理方式
   - proper_nouns: 专有名词翻译原则

输出 JSON 结构:
{
  "characters": { "姓名": { "translation": "", "nicknames": {}, "role": "", "traits": "", "relationships": {}, "speech_style": "" } },
  "places": { "地名": { "translation": "", "description": "" } },
  "concepts": { "术语": { "translation": "", "description": "" } },
  "world_setting": { "time_period": "", "culture": "", "tech_level": "", "social_structure": "", "translation_note": "" },
  "cultural_strategy": { "idioms": "", "measurements": "", "proper_nouns": "" }
}

v4pro的上下文足够大,先在是按章翻译,然后每章抽新知识、总结,合并知识库,翻译下一章。


不过翻译不太会命中缓存
3本花了我大概9块不到的样子。


通过网盘分享的文件:Neural Wraith 1 - 3_zh.epub
链接: https://pan.baidu.com/s/1ozxewrbEIMn3b5YLo4_JRw?pwd=uqk7 提取码: uqk7 复制这段内容后打开百度网盘手机App,操作更方便哦
--来自百度网盘超级会员v9的分享

增加个全译文输出的版本

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

评分

参与人数 1战斗力 +2 收起 理由
秦南心 + 2 好评加鹅

查看全部评分

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2026-6-24 20:12 , Processed in 0.240143 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表