简介
Voicebox 是一个开源 AI 语音工作室,提供声音克隆、听写和音频创作功能。它将多种 AI 语音模型整合到一个易用的界面中,面向创作者、开发者和内容生产者。
主要特性
- 从短音频样本克隆声音。
- 高精度语音转文字听写。
- 多模型支持,覆盖多种语音生成任务。
- 现代化 Web 工作室界面。
使用场景
- 克隆自己的声音用于内容创作和播客。
- 为视频和演示文稿生成配音。
- 使用 AI 听写转录音频录音。
技术特点
- GitHub 29,000+ Star,最受欢迎的开源语音工具之一。
- MIT 协议,完全开源可自托管。