基于情感调控的交互式语音合成方法、系统、介质和产品

正文

推荐专利

申请号：CN202510493069

申请日期：2025-04-18

公开号：CN120260537A

公开日期：2025-07-04

类型：发明专利

摘要

本发明公开了一种基于情感调控的交互式语音合成方法、系统、介质和产品，涉及语音合成领域，包括：选择说话人角色；实时获取说话人角色音频；对说话人角色音频进行语音文字转录，得到第一文本；对说话人角色音频进行音频情感意图识别，得到第二文本；将第一文本和第二文本进行拼接，得到对话文本；对对话文本进行情感调控，得到情感调控对话文本；根据情感调控对话文本和说话人角色，输出目标语音。本发明能够实时捕捉用户输入的情感信息，从而根据用户输入的情感信息对对话文本进行实时动态的情感调整，以使输出的目标语音始终与当前情感状态相匹配，大幅提升了人机交互的自然性和实时性。

技术关键词

交互式语音文本音频人脸特征向量意图识别人脸特征提取人脸识别模型年龄风格计算机程序产品表达式可读存储介质音视频模块处理器图文

系统为您推荐了相关专利信息

一种数智客服系统、方法、设备及介质

多模态交互统一语义理解客服方法人工智能客服技术客服系统

一种具有音视频文件高效压缩功能的移动作业装置

音频移动作业装置信号音视频特征值

数据分析方法、装置、电子设备、存储介质及程序产品

图谱数据分析方法计算机程序指令文本双向长短期记忆

音频处理方法、芯片和电子设备

音频信号谐波电子设备高通滤波器

一种图像数据标注方法及系统

数据标注方法融合标签生成热力图加权欧氏距离矩阵

基于情感调控的交互式语音合成方法、系统、介质和产品

站点导航

APP 下载