发布时间:2023-03-13 16:49 作者:创始人
简述:采用百度新一代面向AIGC的语音合成技术方案,基于雷锋原始录音,即可完成声音建模。
3月5日,正值“向雷锋同志学习”题词60周年,长江日报联合百度智能云打造的“和雷锋一起读《雷锋日记》”上线,采用百度新一代面向AIGC的语音合成技术方案,基于雷锋原始录音,即可完成声音建模,生动地合成模拟雷锋阅读《雷锋日记》的声音,收获了无数用户的点赞!
本次雷锋声音的还原,采用了百度新一代面向AIGC的语音合成技术方案,在核心技术方案上包括三大创新:
1、 大幅降低了录音质量的门槛,无需到录音棚录制,也无需照稿朗读,仅需提供已有录音,1天内即可完成快速建库:依托了百度语音合成研发的语音->文本->语音的自重构预训练框架完成自动建模,可精确提取出对应到字的细粒度声学特征,保留了原始语音中绝大部分的表达方式,使得几句到几万句训练的模型都能够稳定合成;
2、 只需要提供50~150句的语音,即可完成声音建模,获得媲美上千句的企业级音库的效果:创新研发了相应的富表现力合成技术,通过引入概率分布完成一对多的细粒度声学特征建模,为合成提供更多的多样性选择,克服了少量录音数据带来的过平稳问题,做到即使用少量数据也能生动地合成;
3、 突破性还原真人声音及情感表达:将NLP语言预训练模型与TTS声学模型相结合的前后端合成技术,通过将语言模型中潜在的韵律、语义信息提供给声学模型学习,解决录音中语义内容单一的问题,使得合成效果在语义和句式上更加贴切,在跨语境合成中更能契合场景。
百度智能云将充分发挥 AI 技术优势,继续打造智能化创新性服务,助力媒体行业在内容生产上实现更多创新性传播。如果您想要体验AIGC语音合成技术,您可联系在线客服进行预约!
腾佑AI(ai.tuidc.com) 成立于2007年,一直致力于发展互联网IDC数据中心业务、云计算业务、 CDN业务、互联网安全及企业客户技术解决方案等产品服务, 2018年成为百度云河南服务中心。主营服务器租用,服务器托管,虚拟主机, 域名注册,机柜租用,主机租用,主机托管,带宽租用,云主机,CDN加速 , WAF防火墙,网络安全,人脸识别,文字识别,图像识别,语音识别等业务;
售前咨询热线:400-996-8756
备案提交:0371-89913068
售后客服:0371-89913000
热搜词
微信公众号
手机站
COPYRIGHT 2007-2020 TUIDC ALL RIGHTS RESERVED 腾佑科技-百度AI人工智能_百度人脸识别_图像识别_语音识别提供商
地址:河南省郑州市姚砦路133号金成时代广场6号楼13层 I CP备案号:豫B2-20110005-1 公安备案号: 41010502003271
声明:本站发布的内容版权归郑州腾佑科技有限公司所有,本站部分素材来源于网络及网友投稿,若无意中侵犯了您的版权,请致电在线客服我们将在核实后予以删除!