Audio

上传您的音频文件

支持mp3, wav, flac等格式,最大支持50MB

选择使用的大模型

Deepseek V3
功能强大,擅长语音识别与转写
Qwen2.5 VL
通用大模型,支持多模态处理
ERNIE-4.5
百度智能对话大模型,语音处理能力强

功能选择

请选择需要的音频处理功能:

语音识别

准确转写语音内容

音频分离

人声和背景分离

语音克隆

复制您的声音特征

格式转换

多种音频格式互转

音频转PPT

会议录音生成幻灯片

音频转视频

配合AI生成视觉内容

正在处理...

大模型正在分析您的文件

处理完成

下载结果