hehehe12589 发表于 2026-1-16 21:30

SuwayomiGO:查词翻译 | 端云协同 | 自制开源的安卓漫画阅读器 v1.2.0

本帖最后由 hehehe12589 于 2026-1-30 22:27 编辑

原标题:和Gemini聊天半个月,做了一个安卓漫画阅读器:SuwayomiGO
全程靠AI协助开发的安卓漫画阅读器,兼容Mihon/Tachiyomi图源和备份,后面会不定期更新,整点花活,这里转专楼了,记录开发过程,希望能收到一些反馈。
废话不多说,先上GitHub链接:https://github.com/lightningandme/SuwayomiGO
网络不好的可以看看网盘链接:https://pan.quark.cn/s/5c77cedf70b8?pwd=m7pS   提取码:m7pS
交流反馈可加:蓝飞机

再上几张使用效果图:
          这个APK安装包比较小,5MB左右,其实就是依靠系统自己的webview来浏览Suwayomi-Server上的漫画(一个兼容Tachiyomi图源和备份的漫画服务器),界面基本就是它的原生Web-UI。特色是开发了点按漫画文本,OCR识别、AI翻译、词语提取和查询、导出Anki词卡等功能,可以辅助看生肉、查词学日语,不过都是依赖服务端的,需要一定配置步骤,详细可见项目页面。
界面很简单,动画很少,设置也很少,性能比较差的安卓墨水屏也能用,另外做了墨水屏翻页刷新功能。
这些功能都是比较符合我个人需求的,半个月前和Gemini聊天,聊着聊着就把东西做起来了,其实我Python、Java、Kotlin全都不会
这里分享给大家,如果也能满足你的需要,那就再好不过了。

最后贴一些开发中的的截图记录吧。
   







plazum 发表于 2026-1-16 21:51

本帖最后由 plazum 于 2026-1-16 21:52 编辑

《在家里看漫画差点被漫画阅读器气死,但靠着和Gemini聊天半个月做出了体积5MB的安卓漫画阅读器,我要暴打一切阅读器&“给它们好看!”》
hehehe12589/著
Gemini/插图
◯◯文库

[皆神孝介] 发表于 2026-1-16 22:46

Suwayomi-Server总提示服务器版本有更新的弹窗肿么办?楼主知道吗?

hehehe12589 发表于 2026-1-16 22:50

[皆神孝介] 发表于 2026-1-16 22:46
Suwayomi-Server总提示服务器版本有更新的弹窗肿么办?楼主知道吗?

应该是在[设置-服务器-提示可用的更新]里关闭吧

莉洁莉特 发表于 2026-1-17 17:23

纯用AI做的软件吗?

hehehe12589 发表于 2026-1-17 17:47

莉洁莉特 发表于 2026-1-17 17:23
纯用AI做的软件吗?

代码基本都是AI写的,我负责缝合调试。有时候AI会掉进死胡同,需要人来给他灵感。只要你的需求明确,AI写一个个功能函数已经非常靠谱了。

plazum 发表于 2026-1-18 00:15

hehehe12589 发表于 2026-1-17 17:47
代码基本都是AI写的,我负责缝合调试。有时候AI会掉进死胡同,需要人来给他灵感。只要你的需求明确,AI写 ...

楼主用Gemini有充钱吗

hehehe12589 发表于 2026-1-18 07:54

plazum 发表于 2026-1-18 00:15
楼主用Gemini有充钱吗

没有,我主要用的是网页的flash模型

hehehe12589 发表于 2026-1-18 10:10

本帖最后由 hehehe12589 于 2026-1-18 10:15 编辑

方便各位下载体验
链接:https://pan.quark.cn/s/5c77cedf70b8?pwd=m7pS
提取码:m7pS

plazum 发表于 2026-1-18 12:49

hehehe12589 发表于 2026-1-18 07:54
没有,我主要用的是网页的flash模型

哇,不充钱的效果都这么好

好大一只绅士 发表于 2026-1-18 13:44

不明觉厉

hehehe12589 发表于 2026-1-18 21:21

再补充一个圈选和点选的演示吧。
程序的背后逻辑是这样的:点选会识别对话框气泡(mode1),判断为没有气泡的话会自己寻找附近的可识别文本(mode2),如果全部失败,则会返回一个保底范围给下一步的OCR识别(mode3)。
当你觉得文本识别出问题的时候,很可能是程序没有截准你想要的文本范围,一般有气泡框的时候是很难翻车的,但复杂背景、艺术字体、奇怪形态的对话框会增加识别难度,这时候往往手动圈选的效果是最好的。


蚊仔蚊仔蚊仔 发表于 2026-1-18 21:49

滋瓷

hehehe12589 发表于 2026-1-19 09:40

周一来划水了~我看这回复数和收藏数不成正比啊,有朋友亲测跑通的吗?好用不好用都谈一下感受呗

hehehe12589 发表于 2026-1-30 19:23

后续改进计划。

原先的AI翻译为了快速响应,用的是单句翻译。最近在尝试联系上下文的AI翻译,翻译效果当然是比之前好,有些需要结合语境的对话更加准确,不过于此同时,AI翻译的处理速度也变慢了,毕竟现在是全章节处理。
目前的想法是预加载漫画,打开漫画以后就全速处理一整套OCR和翻译,翻译结果存进一个“大而美”的数据库里,用户实际点击的时候,就索引调用结果,如果点击时候还没处理完,就调用原版的单句翻译先顶着,尽量做到无感。
后面再开脑洞,也许会做全翻译的汉化文本嵌入,还有图片超分,看看反响,慢慢来吧。
贴一个初步测试的数据库:

charlespfan 发表于 2026-1-30 20:08

感觉和 捧读 app 有点像
https://play.google.com/store/apps/details?id=com.kevinzhow.pengdu&hl=zh&referrer=utm_source%3Dgoogle%26utm_medium%3Dorganic%26utm_term%3D%E6%8D%A7%E8%AF%BB&pcampaignid=APPU_1_NZ18acWDCIvU1e8P16L04A8

还有个类似的 OCR Manga Reader
https://ocrmangareaderforandroid.sourceforge.net/

手机端漫画翻译的话,最近有个开源项目,中文名叫 MT阅读器
https://github.com/jedzqer/manga-translator

—— 来自 S1Fun

hehehe12589 发表于 2026-1-30 22:53

本帖最后由 hehehe12589 于 2026-1-30 22:56 编辑

charlespfan 发表于 2026-1-30 20:08
感觉和 捧读 app 有点像
https://play.google.com/store/apps/details?id=com.kevinzhow.pengdu&hl=zh&refe ...
感谢分享,这3个简单看了一下。
第1个像是自带了一个语料库的日语学习软件
第2个像是本地漫画OCR加翻译,一样可以导出anki词卡,不过界面看上去有些旧了
第3个在AI翻译方面已经做得比我远了,应该有不少我可以借鉴的地方。
我现在做的东西可能要更综合一点,首先它基于Suwayomi,所以同时支持Mihon在线图源和本地漫画,其次它的思路是端云协同,客户端非常小,对低端处理器也很友好。是在一个已经非常完善的漫画阅读生态系统上,增加了生肉辅助阅读和日语学习这些功能属性的,可以针对生肉做到比较好的沉浸式阅读学习。再画个饼的话,如果后面开发顺利的话,应该可以替代一部分翻译组的工作,汉化不求人,可以第一时间读到最新的自制熟肉。

hehehe12589 发表于 2026-2-4 22:50

记录下进度,生肉的后端全文翻译搞好了,配合预加载,可以把所有处理好的汉化台词返回给阅读端。过年前摸鱼比较方便,明天开始做前端功能。



页: [1]
查看完整版本: SuwayomiGO:查词翻译 | 端云协同 | 自制开源的安卓漫画阅读器 v1.2.0