微软今天宣布了Custom Neural Voice的全面上市,这是一种Azure认知服务产品,使开发人员可以使用神经文本语音转换技术来创建合成语音 。它的访问权限受到限制,这意味着客户必须申请并获得Microsoft的批准,但是它已经可以投入生产,并且可以在大多数Azure云区域中使用 。
诸如Progressive的Flo之类的品牌声音通常要负责录制电话树,以学习公司培训视频中使用的脚本 。合成可以通过减少额外的录音和接听(录制会话来解决配音脚本中的错误,更改或添加)来提高演员的工作效率 。同时,它可以使他们腾出精力从事创造性工作,并使他们能够收集残差 。
借助自定义神经语音,韵律-每个音素的音调和持续时间,将一个词与另一个词区分开的声音单位-组合在一起,因此在Azure中运行的机器学习模型可以紧密地再现演员的声音或完全原始的声音 。一组模型将脚本转换为声音序列,预测韵律,而另一组模型将该声学序列转换为语音 。微软声称,由于这些模型可以同时预测正确的韵律并合成语音,因此“自定义神经语音”可产生听起来更自然的声音 。
微软表示,“自定义神经语音”包含有助于防止滥用该服务的控件 。当客户提交录音时,配音演员会发表声明,确认他们(1)了解技术,并且(2)知道客户正在发出声音 。使用扬声器验证将录音与模型训练数据进行比较,以确保在客户可以开始创建声音之前,声音匹配 。微软还根据合同要求客户获得语音人才的同意 。
【微软推出了受限访问功能的自定义神经语音】除此之外,微软表示将审查每个潜在的用例,并让客户同意其行为准则,然后才能开始使用“自定义神经语音” 。“我们要求客户非常清楚地表明这是一种综合声音,” Azure AI认知服务负责人AI负责人Sarah Bird在一份声明中说 。“当它在上下文中不是立即显而易见时,[客户必须]以用户可感知的方式明确披露它是合成的,而不是隐含在术语中 。”
推荐阅读
- Garner筹集了1200万美元以使员工与高绩效医生匹配
- 快手咋地才能隐藏作品,快手隐藏作品怎么操作
- 车上的pull是什么意思
- 摩托车油表怎么看
- 日产,GTR35价格多少
- 汽车方向盘打法
- 早就不爱了 就是因为利益而不愿分开的星座
- 红颜祸水命是什么意思,红颜祸水天注定是什么意思
- 前任在这几个星座心里真是什么都不是了