平安科技申请语音合成专利,能提高语音的自然度、可信度、感染力和说服力
2025-08-23147
金融界2024年11月11日消息,国家知识产权局信息显示,平安科技(深圳)有限公司申请一项名为“语音合成方法、装置、计算机设备及存储介质”的专利,公开号CN118918878A,申请日期为2024年8月。
专利摘要显示,本申请实施例提供了一种语音合成方法、装置、计算机设备及存储介质。方法涉及语音合成技术,应用于金融领域,包括:获取待合成的初始文本和参考音频;将初始文本输入至预设的音素编码器,输出初始文本对应的多个音素;将参考音频输入至预设的韵律编码器,输出参考音频对应的多个韵律;基于自注意力机制获取每个音素和多个韵律进行对齐,获取每个音素对应的嵌入信息;嵌入信息包括至少一个韵律和每个韵律对应的权重;根据每个音素和对应的嵌入信息生成梅尔频谱,根据梅尔频谱生成合成音频,完成初始文本和和参考音频的韵律对齐。合成后音频中韵律将出现在准确位置,能提高语音的自然度、可信度、感染力和说服力,能适应不同应用场景和用户偏好。
本文源自金融界