Voicebox – Meta旗下语音合成模型 Voicebox 是由 Meta AI 研究团队开发的一款领先的语音生成模型。Voicebox 能够在六种语言中合成语音,消除瞬态噪声,编辑内容,在语言之间转移音频风格,并生成多样的语音样本。此外,它生成语音的速度比最先进的自回归模型快 20 倍。
MetaVoice Studio – 高质量AI配音服务 MetaVoice Studio允许用户录制自己的声音或上传文件来创建自定义语音剪辑。它提供了一个免费的计划,有6个声音,30秒的剪辑长度,和一个非商业许可。付费计划包括8个声音、10分钟剪辑长度、商业许可和自定义声音(即将推出)。它还提供了具有自定义定价、API访问和微调支持的企业解决方案。
ChatTTS – 免费开源的用于对话场景的语音合成模型 ChatTTS是一个开源的专为对话场景设计的语音生成模型,特别适用于大语言模型(LLM)助手的对话任务,以及诸如对话式音频和视频介绍等应用。ChatTTS 不仅能说中文,英文也能 hold 住,还支持一些细粒度控制,它允许你加入笑声、说话间的停顿,还有语气词,可玩性很强。 它通过使用大约100,000小时的中文和英文数据进行训练,ChatTTS在语音合成中表现出高质量和自然度,实现了自然流畅的语音合成,同时支持多说话人。
米可智能 – 一站式视频翻译和声音克隆 米可智能通过其AI技术,为用户提供了一个高效、便捷的视频翻译和声音克隆服务。无论是自媒体博主、教师还是市场营销人员,都能通过米可智能提升工作效率,打破语言障碍,实现音视频内容的国际化。
Podcast.ai – 人工智能生成的播客平台 Podcast.ai提供了一个独特的体验,将人工智能技术应用于播客内容的创作。无论是机器学习爱好者还是希望以新方式了解特定主题的听众,都可以在这个平台上找到感兴趣的内容。