今天,OPENAI宣布开放GPT4o以及GPTS给所有用户,简直是魔幻。估计是看到国内的价格战,OPENAI也慌了吧(当然不是)!
这两天在国内最大的亮点是开源项目Chat-TTS了,通过这个模型生成近似于真人的声音。先带大家体验一波:
ChatTTS是专门为对话场景设计的文本转语音模型,例如LLM助手对话任务。它支持英文和中文两种语言。最大的模型使用了10万小时以上的中英文数据进行训练。在HuggingFace中开源的版本为4万小时训练且未SFT的版本.
目前开放的功能已经很强大了,后续还有迭代计划。作者介绍,本项目的亮点:
对话式 TTS: ChatTTS针对对话式任务进行了优化,实现了自然流畅的语音合成,同时支持多说话人。
细粒度控制: 该模型能够预测和控制细粒度的韵律特征,包括笑声、停顿和插入词等。
更好的韵律: ChatTTS在韵律方面超越了大部分开源TTS模型。同时提供预训练模型,支持进一步的研究。
再来体验下颗粒度控制:
通过模型自动断句,能很好衔接上下句,又不会让人觉得不自然。
最让我惊艳的是AI数字人的笑声,很真实,你们体验下:
项目地址:https://github.com/2noise/ChatTTS
这个项目要跑起来需要GPU,而且部署需要技术。
本文链接:https://aipeiyin.cc/peiyin/12.html
ai智能配音软件视频解说ai配音教程常州ai配音电话多少英语配音AI配音奥特曼ai配音泰语ai配音ai配音潮汕激昂ai配音ai防弹配音ai配音圈
网友评论