从最开始的大牌明星定制语音包,到全世界第一个个人语音定制作用,在语音定制这一行业,百度地图可谓是走在业内前端,这都归功于百度搜索独创性的Meitron音质韵律转移技术性。现如今,此项技术性再度迈入创新,客户只必须录制9句话就可以轻松玩语音定制,巨大减少了语音定制作用的应用门坎,那麼百度地图是怎么保证的呢?
(百度地图语音定制作用发布9句话录制的“极速模式”)
2019年9月,百度地图推出世界第一个地图语音定制商品,客户必须录制20句、每句话15个字上下的文字,通过15-20min的AI练习,最后完成定制语音包的生成导出。而现如今,借助百度搜索独创性的时间可控性端到端生成技术性,更新后的地图语音定制作用对这其中的Tacotron实体模型开展了调节和提升,特别是在Location Sensitive Attention的体制上,促使语音生成全过程里时长信息内容的获得更为灵便、可控性,巨大提升了培训转移的可靠性,就算根据非常少的句子也可以开展平稳的生成,最后完成了从20句到9句的录制减缩。
虽然录制全过程干了加减法,但百度地图依然可以转化成一如既往的高质量语音生成实际效果,这身后依靠的,便是百度搜索独创性的音质设计风格粗粒度伺服电机。根据Global Style Tokens技术性,本次更新加强了分离出来音质设计风格信息内容的工作能力,提高了音质设计风格提取的一致性,就算仅有少量的句子,也可以进行平稳的音质设计风格操纵和转移。
现阶段,百度地图智能化语音小助手用户数量超4亿,人性化语音包每日播放视频频次超1亿个。伴随着百度地图语音定制作用的再度更新,坚信会出现愈来愈多客户去试着录制自身独有的语音包,在导航栏、语音互动、智能化度假旅游等诸多地图情景中,感受本人专享语音包的风采。