TTS-Voice-Wizard TTS语音向导是一种工具,允许用户通过微软Azure语音识别和TTS将语音转换为文本,然后再转换回语音。它还向VRChat发送OSC消息以在头像上显示文本。该工具有许多自定义选项,包括100多种不同的声音,20多种支持的语言,并能够显示歌曲标题,艺术家和用户以上的进度。
Synthesizer V Synthesizer V是一款革命性的音乐制作工具,它使用基于深度神经网络的合成引擎来生成令人难以置信的逼真的歌声。它具有可定制的AI音高生成,无限音轨,无核心限制,VST3/AU插件支持,ASIO支持(Windows), Jack支持(Linux),跨语言合成,AI重取,孤立的抽吸输出,发声模式,音调偏移参数,Microtonal调整,MIDI键盘支持,节拍器和Lua/Javascript脚本。这似乎是一个突破性的工具。
Synthesys Synthesys是一家领先的AI虚拟媒体平台,用户只需点击几下鼠标就可以制作专业的AI画外音和AI视频。它为用户提供了一个大型的专业声音库,74种humatar, 38种女性和36种男性声音,66种语言和254种风格。它还具有基于云的应用程序、完全定制和高分辨率输出。Synthesys非常适合创建解释器视频,电子学习,社交媒体,产品描述等。
Speech Studio Speech Studio是一套用于构建和集成Azure认知服务语音服务功能到应用程序中的工具。它为创建项目提供了一种无需代码的方法,可以访问诸如实时语音到文本、自定义语音识别模型、发音评估、语音库、自定义语音、音频内容创建、自定义关键字和自定义命令等功能。
MotionSound – 智能AI语音生成器和AI配音工具 MotionSound是一款智能AI语音生成器,采用领先的语音合成技术,利用深度学习算法和自然语言处理技术,生成自然流畅、声音清晰、表达准确的语音。这款工具支持多种语言和声音类型,并提供丰富的声音控制选项,使用户能够自由定制所需的语音。