找回密码
 立即注册
查看: 3443|回复: 5

[软件] 现在ai吹的这么厉害,有没有可以多人声分离的工具

[复制链接]
发表于 2024-3-3 09:23 | 显示全部楼层 |阅读模式
本帖最后由 midearth 于 2024-3-3 09:50 编辑

就是一段音轨有多个人说话,能不能把其中某个人的声音提取出来。
因为基本都是轮流说话,所以手动截取某些时间段也行,但有没有工具可以自动做到这点了?
补充下,是音频分离,不是转写,自己用,要免费的
回复

使用道具 举报

     
发表于 2024-3-3 09:36 来自手机 | 显示全部楼层
飞书妙记
回复

使用道具 举报

     
发表于 2024-3-3 09:38 | 显示全部楼层
有很多支持会议记录的工具
回复

使用道具 举报

头像被屏蔽
     
发表于 2024-3-3 12:23 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2024-3-3 13:17 | 显示全部楼层
研究过,目前是能识别多说话人,但是不能完全识别
回复

使用道具 举报

     
发表于 2024-3-3 14:30 | 显示全部楼层
免费的试一下IBM Watson和Google Cloud,之前试过还过得去
如果是针对汉语的可以试试讯飞和企鹅,不过企鹅的是商用的

一步到位做音频分离的我印象里现在还没有,不过既然你都提了基本都是轮流说话,没有重叠的情况下,ASR过后拿结果的时间段去调ffmpeg或者gstreamer去切不就好了
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2025-4-30 09:29 , Processed in 0.025197 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表