Synthesizer V – 深度神经网络技术来生成逼真的歌声 Synthesizer V是一款革命性的音乐制作工具,它使用基于深度神经网络的合成引擎来生成令人难以置信的逼真的歌声。它具有可定制的AI音高生成,无限音轨,无核心限制,VST3/AU插件支持,ASIO支持(Windows), Jack支持(Linux),跨语言合成,AI重取,孤立的抽吸输出,发声模式,音调偏移参数,Microtonal调整,MIDI键盘支持,节拍器和Lua/Javascript脚本。这似乎是一个突破性的工具。
声咖 – 搜狗出品的AI音视频创作平台 声咖是由搜狗公司开发的AI音视频创作平台,基于自研的语音合成技术,提供一键文字转语音、音频变声、音频工具箱等功能,满足新闻播报、视频配音、有声小说、语音助手等音频制作需求。声咖旨在以低成本、高效率的方式帮助创作者制作高品质音频内容。
灵动AI – 工业级商品图AI生成工具 工业级商品图AI生成工具,利用 AI 生成技术,并结合自研的商品+场景融合系列专用AI模型及智能审美评价系统,快速创造高质量商品场景图,智能辅助设计,为B端用户和设计师创作高质量商品场景图提供助力
Speech Studio Speech Studio是一套用于构建和集成Azure认知服务语音服务功能到应用程序中的工具。它为创建项目提供了一种无需代码的方法,可以访问诸如实时语音到文本、自定义语音识别模型、发音评估、语音库、自定义语音、音频内容创建、自定义关键字和自定义命令等功能。