Ai配音|配音网|chattts

在GPT-4o的New Voice出来之前,语音模型推荐你使用ChatTTS

AI配音网2024-05-31 08:08:55183
五月中旬Open AI推出新一代大模型GPT-4o时震惊世界,大家感慨最大的,无非两点:1)语音对话延迟极低,接近真人的反应时间;2)另外就是语音的拟人化和情感化,那语气也太像真人了。据此大家都惊呼,her时代要来了。

但可惜的是,此New Voice模型并没有随GPT-4o模型一起同时发布,还需要等,具体发布时间也未可知。我估计很多人也和我一样,在等待着这款AI神器的降临。

因为很多AI应用的场景,使用真人感的语音能带来翻天覆地的效果,包括最近微信读书的AI语音播放都已经升级为类人效果了,音色和语调比之前好出很多,对于习惯听书的人来说,直到这时候才有了听“说书”的感觉,因为真的像是一个人在专门给你读书,效果棒极了。

在4o之前我一直对外说,中文语音效果我最推崇的是微软,那确实是其他家望其项背的。自从去年我亲自克隆了几款经典动漫角色声音后,我始终都持此观点,直到4o出来。

而4o也让我有了更高和更多的期待,期待Open AI肯定会带动一波新的高真人感的实时对话语音模型涌现和竞争。

果不其然,昨日媲美GPT-4o的语音模型-ChatTTS发布了,支持中英文语音,效果极其炸裂。

ChatTTS应该是目前对中文支持最好的了语音模型了,专门为对话场景设计的文本到语音的TTS模型。具体音效,可以戳下面视频感受下:

该模型据说经过超过10万小时的训练,公开版本在 HuggingFace 上提供了一个4万小时预训练的模型。专为对话任务优化,能够支持多种说话人语音,中英文混合,中文方言等。

模型还能够预测和控制细粒度的韵律特征,这也是他厉害或者接近4o之处,如笑声、停顿、插话等,还能进行更细粒度的调整,如语速、音调和情感等。

具体体验地址可以查看:GitHub:github.com/2noise/ChatTTS

可以说,ChatTTS是一款副语言效果表现非常出众的模型,能够很好模拟出不同人物的音色、语速、语调,传递出类人的真实情绪和情感,真正消除了AI的机械感,非常适合情感对话和互动陪伴。

不难预见,这一波语音模型的效果提升,势必会带来AI应用层极大的革新,不仅仅是语音体验,更是全方位的类真人互动感知!更有可能带应用层的爆点出现。

快,模型层还是得持续卷起来!

因为目前的AI应用层还急需靠模型的带动。

对于这一点,是迫不及待的!

本文链接:https://aipeiyin.cc/peiyin/5.html

抖音最火的男生AI配音热门ai配音法文ai配音杨晨ai配音ai配音说书矩阵ai配音ai文稿配音ai 配音 原型和尚ai配音ai配音idol

相关文章

网友评论