录音人声分离

上传包含两人对话的录音文件,AI会自动提取两人的声音,分别导出为主说话人和次说话人轨道。

1 上传文件

支持 audio/mpeg, audio/wav, audio/x-wav, audio/mp4, audio/x-m4a, video/mp4
点击选择文件,或拖拽文件到这里

单个文件最大 100MB

已选择的文件

2

设置参数

上传包含双人对话的录音文件,AI 模型会自动进行端点检测与说话人聚类,并分离出主说话人和次说话人的独立音频轨道。
生成结果将提供独立的两条音频轨道直接下载。

准备就绪

处理完成!

处理失败

如何使用 录音人声分离?

1

选择文件

点击上传或将文件拖拽至指定区域

2

调整参数

根据需要设置相应的处理参数

3

开始处理

点击按钮,云端服务器将快速处理文件

4

下载结果

处理完成后,将生成的文件下载到本地

录音人声分离 的功能特点

  • 无需安装 在浏览器中即可完成操作,不占用电脑空间。
  • 全平台兼容 支持 Windows, Mac, Linux 以及 iOS 和 Android。
  • 隐私安全保护 文件通过加密通道传输,处理完成后自动从服务器删除。
  • 高速处理 强大的云端服务器支持,几秒内即可拿到处理结果。

关于 录音人声分离 的常见问题

支持多人吗?

目前最佳效果为双人对话分离,自动导出两轨音频。

如果背景很嘈杂能分离吗?

模型内置了VAD(语音活动检测)可以一定程度上过滤噪音。

生成的文件格式是什么?

输出一个zip文件,内含分离后的两人音频(mp3格式)。