但可惜的是,此New Voice模型并没有随GPT-4o模型一起同时发布,还需要等,具体发布时间也未可知。我估计很多人也和我一样,在等待着这款AI神器的降临。
因为很多AI应用的场景,使用真人感的语音能带来翻天覆地的效果,包括最近微信读书的AI语音播放都已经升级为类人效果了,音色和语调比之前好出很多,对于习惯听书的人来说,直到这时候才有了听“说书”的感觉,因为真的像是一个人在专门给你读书,效果棒极了。
在4o之前我一直对外说,中文语音效果我最推崇的是微软,那确实是其他家望其项背的。自从去年我亲自克隆了几款经典动漫角色声音后,我始终都持此观点,直到4o出来。
而4o也让我有了更高和更多的期待,期待Open AI肯定会带动一波新的高真人感的实时对话语音模型涌现和竞争。
果不其然,昨日媲美GPT-4o的语音模型-ChatTTS发布了,支持中英文语音,效果极其炸裂。
ChatTTS应该是目前对中文支持最好的了语音模型了,专门为对话场景设计的文本到语音的TTS模型。具体音效,可以戳下面视频感受下:
该模型据说经过超过10万小时的训练,公开版本在 HuggingFace 上提供了一个4万小时预训练的模型。专为对话任务优化,能够支持多种说话人语音,中英文混合,中文方言等。
模型还能够预测和控制细粒度的韵律特征,这也是他厉害或者接近4o之处,如笑声、停顿、插话等,还能进行更细粒度的调整,如语速、音调和情感等。
具体体验地址可以查看:GitHub:github.com/2noise/ChatTTS
可以说,ChatTTS是一款副语言效果表现非常出众的模型,能够很好模拟出不同人物的音色、语速、语调,传递出类人的真实情绪和情感,真正消除了AI的机械感,非常适合情感对话和互动陪伴。
不难预见,这一波语音模型的效果提升,势必会带来AI应用层极大的革新,不仅仅是语音体验,更是全方位的类真人互动感知!更有可能带应用层的爆点出现。
快,模型层还是得持续卷起来!
因为目前的AI应用层还急需靠模型的带动。
对于这一点,是迫不及待的!
本文链接:https://aipeiyin.cc/peiyin/5.html
抖音最火的男生AI配音热门ai配音法文ai配音杨晨ai配音ai配音说书矩阵ai配音ai文稿配音ai 配音 原型和尚ai配音ai配音idol
网友评论