语音生成方法、设备、介质和计算机程序产品

正文

推荐专利

申请号：CN202411032546

申请日期：2024-07-30

公开号：CN118972485A

公开日期：2024-11-15

类型：发明专利

摘要

本公开涉及通信技术领域，尤其是提供一种语音生成方法、设备、介质和计算机程序产品。上述语音生成方法包括：在被叫用户激活智能回复功能的情况下，获取主叫用户的音频数据和被叫用户的声纹特征；对音频数据进行语义识别处理，获得主叫用户的情绪信息和意图信息，并基于情绪信息和意图信息生成回复文本；基于声纹特征将回复文本转换为初始语音回复；对初始语音回复进行降噪处理，获得目标语音回复，并向主叫用户发送目标语音回复。本公开通过综合使用语义识别技术、个性化的声纹特征和降噪处理，使得生成的语音回复能真实还原自然人在类似情况下的自然反应，使得智能语音回复更加真实，提高了用户的通话体验。

技术关键词

语音生成方法声纹特征时间感知模块语音编解码器意图情绪识别模型情绪特征语音识别模型计算机程序产品卷积编码器文本特征提取模块网络结构数据语义识别技术音频特征模板

系统为您推荐了相关专利信息

基于人工智能的用户标签生成方法及系统

标签生成方法最终用户生成用户离散特征标签生成系统

基于组件动态生成的智能页面编辑方法及系统

页面编辑方法教学组件策略指令逻辑

一种基于AI的高考志愿填报方案推荐方法及相关装置

高考志愿填报推荐系统推荐方法专业分析模块

基于人工智能的交互式沙盘演示系统

沙盘演示系统语义意图可视化模块表达序列策略

面向人工智能大模型开发的低代码自动化生成与部署系统

节点自然语言建模映射关系表调度算法自然语言解析

语音生成方法、设备、介质和计算机程序产品

站点导航

APP 下载