首页 / 全部工具 / 录音人声分离

录音人声分离

上传包含两人对话的录音文件，AI会自动提取两人的声音，分别导出为主说话人和次说话人轨道。

1 上传文件

支持 audio/mpeg, audio/wav, audio/x-wav, audio/mp4, audio/x-m4a, video/mp4

点击选择文件，或拖拽文件到这里

单个文件最大 100MB

已选择的文件

2

设置参数

上传包含双人对话的录音文件，AI 模型会自动进行端点检测与说话人聚类，并分离出主说话人和次说话人的独立音频轨道。
生成结果将提供独立的两条音频轨道直接下载。

准备就绪

处理完成！

全选 / 取消全选

处理失败

如何使用录音人声分离？

1

选择文件

点击上传或将文件拖拽至指定区域

2

调整参数

根据需要设置相应的处理参数

3

开始处理

点击按钮，云端服务器将快速处理文件

4

下载结果

处理完成后，将生成的文件下载到本地

录音人声分离的功能特点

无需安装 在浏览器中即可完成操作，不占用电脑空间。
全平台兼容 支持 Windows, Mac, Linux 以及 iOS 和 Android。
隐私安全保护 文件通过加密通道传输，处理完成后自动从服务器删除。
高速处理 强大的云端服务器支持，几秒内即可拿到处理结果。

关于录音人声分离的常见问题

支持多人吗？

目前最佳效果为双人对话分离，自动导出两轨音频。

如果背景很嘈杂能分离吗？

模型内置了VAD（语音活动检测）可以一定程度上过滤噪音。

生成的文件格式是什么？

输出一个zip文件，内含分离后的两人音频(mp3格式)。

相关 PDF 工具

音频格式转换