找回密码
 立即注册
搜索
查看: 1208|回复: 25

[软件] 求一个电脑上能方便听录音文件写讲话稿的软件

[复制链接]
     
发表于 2025-11-6 17:12 | 显示全部楼层 |阅读模式
涉密不能上网,所以没办法用各种需要联网的录音转文字软件,只能人力硬怼


现在是potplay听一点录音,在word里打一段字,

一个是要老打←键(已经设为播放器全局快捷键)回放重听,很麻烦不说,键盘还老打架,
另一个第一次快打打完的稿子也没办法对上录音时间,回头校对重打对时间要找很久
回复

使用道具 举报

     
发表于 2025-11-6 17:34 | 显示全部楼层
whisper,不过没gpu的话就得用小模型
回复

使用道具 举报

     
发表于 2025-11-6 18:07 | 显示全部楼层
录音都行 OBS?
模型看你电脑 最近几年的电脑跑whisper应该问题都不大
推荐优化过的whisperX

额 你需要实时吗?
回复

使用道具 举报

     
发表于 2025-11-6 18:59 来自手机 | 显示全部楼层
你这不是有potplayer么,右键 - 字幕 - 生成有声字幕。下载模型需要联网,生成字幕过程不需要联网。largev2就行,v3提升很小。

—— 来自 鹅球 v3.5.99-alpha
回复

使用道具 举报

发表于 2025-11-6 20:44 来自手机 | 显示全部楼层
memo.ac
试试看
回复

使用道具 举报

     
发表于 2025-11-6 20:55 | 显示全部楼层
中文ASR用小模型精度都太低,当然确实也能减小录入的工作量
想准确的话用Qwen Audio或者Whisper-large,小模型的话就Funasr
回复

使用道具 举报

     
发表于 2025-11-6 23:36 | 显示全部楼层
github上的项目:https://github.com/HaujetZhao/CapsWriter-Offline,可以离线使用
回复

使用道具 举报

     
发表于 2025-11-7 00:13 来自手机 | 显示全部楼层
capswriter+1。但你怎么把它搞进去呢刻盘吗

—— 来自 鹅球 v3.5.99
回复

使用道具 举报

     
 楼主| 发表于 2025-11-7 09:52 | 显示全部楼层
紧那罗 发表于 2025-11-6 18:07
录音都行 OBS?
模型看你电脑 最近几年的电脑跑whisper应该问题都不大
推荐优化过的whisperX

不用实时,但单位的电脑是只有核显的

涉密文件都不能上网,也不用想着什么带回家用自己游戏主机怼模型的事情了
回复

使用道具 举报

     
 楼主| 发表于 2025-11-7 09:52 | 显示全部楼层
ysubm 发表于 2025-11-6 18:59
你这不是有potplayer么,右键 - 字幕 - 生成有声字幕。下载模型需要联网,生成字幕过程不需要联网。largev2 ...

可导出么?
回复

使用道具 举报

     
发表于 2025-11-7 10:36 | 显示全部楼层
GMJ 发表于 2025-11-7 09:52
不用实时,但单位的电脑是只有核显的

涉密文件都不能上网,也不用想着什么带回家用自己游戏主机怼模型的 ...

你在自己电脑上把模型环境配好, 拷进去就行了.
ASR对算力的要求其实没那么高 你如果对效率要求不高 用cpu跑也是可以的
回复

使用道具 举报

发表于 2025-11-7 10:39 来自手机 | 显示全部楼层
电脑开外放,手机打开飞书妙记
回复

使用道具 举报

     
 楼主| 发表于 2025-11-7 14:44 | 显示全部楼层
Su7 发表于 2025-11-7 10:39
电脑开外放,手机打开飞书妙记

没用,试过了,本来就是大会堂的演讲录音失真很多,再我喇叭出来重收录失真更多。根本识别不了

直接把原录音文件导入讯飞的机器,又不让导入,机器只能文件复制到电脑,反向不能写入。
回复

使用道具 举报

发表于 2025-11-7 15:32 来自手机 | 显示全部楼层
GMJ 发表于 2025-11-7 14:44
没用,试过了,本来就是大会堂的演讲录音失真很多,再我喇叭出来重收录失真更多。根本识别不了

直接把原 ...


上对录?

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

     
 楼主| 发表于 2025-11-10 08:51 | 显示全部楼层
本帖最后由 GMJ 于 2025-11-10 08:56 编辑

讯飞那个设备是没有3.5mm耳机口的。。只有一个usb-typc的充电+单向导出数据接口

我觉得应该不会流出这么简单就能破解的bug在,毕竟你这样相当于1000左右买了个可永久+无限制+离线语音转文字的设备了,人家在线的收费语音转文字就没法卖了。
回复

使用道具 举报

发表于 2025-11-10 09:09 来自手机 | 显示全部楼层
电脑开个外放,然后手机用腾讯会议

—— 来自 Sony XQ-EC72, Android 16, 鹅球 v3.5.99
回复

使用道具 举报

     
 楼主| 发表于 2025-11-10 09:12 | 显示全部楼层
FFFreddie 发表于 2025-11-10 09:09
电脑开个外放,然后手机用腾讯会议

—— 来自 Sony XQ-EC72, Android 16, 鹅球 v3.5.99 ...

试过了,前面有回复过,2次损失后转告错误离谱到的不可用,不如我无稿直接听码字
回复

使用道具 举报

     
发表于 2025-11-10 23:39 | 显示全部楼层
录音文件反复播放+讯飞离线录音转写喽


—— 来自 S1Fun
回复

使用道具 举报

     
 楼主| 发表于 2025-11-11 08:59 | 显示全部楼层
我记得以前有这么个专门用来听录音转文字的软件,上面菜单栏就是播放的时间轴,下面就是简易的word一样的界面,
他会自己先转一遍录音生成文字,当然错误很多,所以需要你人工修正,但好处是在他在转录的时候每个文字段落甚至每个句号,都对应上面录音时间轴的一段,也就是说你修改的时候点击这句话,他就会播放对应的那一小段录音。不用再去操作录音软件拖时间条。

都改完了可以保存为word。

不知道有没有人知道叫啥
回复

使用道具 举报

     
发表于 2025-11-11 09:05 | 显示全部楼层
本帖最后由 紧那罗 于 2025-11-11 09:07 编辑

想了下,我觉得你的需求应该是类似字幕编辑的需求。 subtitle edit之类的字幕编辑工具试试? whisper可以输出srt格式的文件,可以先用ai粗翻一遍生成时间轴,然后自己精校


比如这个支持离线ai模型

https://github.com/WEIFENG2333/VideoCaptioner

论坛助手,iPhone
回复

使用道具 举报

     
 楼主| 发表于 2025-11-11 09:09 | 显示全部楼层
本帖最后由 GMJ 于 2025-11-11 09:12 编辑
紧那罗 发表于 2025-11-11 09:05
想了下,我觉得你的需求应该是类似字幕编辑的需求。 subtitle edit之类的字幕编辑工具试试? whisper可以输 ...

这个路子倒是没想过,确实和做视频字幕有异曲同工之妙,

如果可以自定义界面,我把视频预览等模块都关掉,精简一下UI,只保留音轨和字幕模块,效率还能再提高
回复

使用道具 举报

     
发表于 2025-11-11 09:13 | 显示全部楼层
buzz就行,whisper先粗生成,然后有时间轴可以边听边改
回复

使用道具 举报

     
发表于 2025-11-11 10:48 | 显示全部楼层
whisper需要N卡的,whisper本身对中文的效果就一般,small之类的小模型效果更差,要稍好点就得上large,用CPU就会慢到受不了。建议用sense-voice,模型小,中文效果据说还略胜whisper large,至少也是同一水平。CPU速度也挺快。也有很多傻瓜项目支持sense-voice,比如nosub。
回复

使用道具 举报

     
发表于 2025-11-12 09:58 | 显示全部楼层
capswriter拖文件进去可以直接生成字幕文件,你要修改对照着录音修改文件就行了,自己添加说话人
回复

使用道具 举报

     
发表于 2025-11-12 10:11 来自手机 | 显示全部楼层
下载 whisper 的离线模型,放到 potplayer 的安装文件夹,开启实时生成字幕,播放就会自动生成了,编辑时可以用字幕浏览器校对。
这个是即时可用的方案,一般是吃饭前点开播放,吃完回来就有字幕了
回复

使用道具 举报

     
发表于 2025-11-12 11:48 来自手机 | 显示全部楼层
aegisub,开频谱,相当于手动打轴听写。不过要是我肯定先模型过一遍生成时间轴和基本文本

—— 来自 vivo V2405A, Android 15, 鹅球 v3.5.99
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-11-12 16:52 , Processed in 0.184122 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表