语音文本双向转换方法、装置、设备及介质

正文

推荐专利

语音文本双向转换方法、装置、设备及介质

申请号：CN202510826684

申请日期：2025-06-19

公开号：CN120673761A

公开日期：2025-09-19

类型：发明专利

摘要

本发明涉及语音处理技术领域，可应用于金融科技及医疗健康等业务场景中，公开了一种语音文本双向转换方法、装置、设备及介质，包括：根据输入信息类型，分别执行语音识别或语音合成操作；对于语音信息，结合唇动视频数据生成噪声抑制参数并执行降噪处理，提升识别准确性；对于文本信息，获取预生成的说话人风格向量，并在语音合成过程中引用该向量生成自然的个性化语音，并生成与语音输出同步的唇动信息和触觉反馈。本发明通过融合唇动数据抑制复杂噪声、利用风格向量生成个性语音、输出唇动与触觉信息，实现复杂环境下语音与文本的双向实时转换，有效提升识别准确性、语音自然度和交互同步性。

技术关键词

双向转换方法多模态环境文本频谱特征风格惯性传感器生成噪声双向转换装置噪声抑制数据语音识别模型视频参数生成触觉反馈声学特征执行语音识别声码器个性化语音

系统为您推荐了相关专利信息

一种移动终端通讯方法、移动终端及存储介质

移动终端通讯方法识别码通讯设备属性识别模型文本识别

基于多模态问答大模型的持镜机器人控制方法及系统

持镜机器人机器人控制方法多模态坐标误差图像嵌入

一种基于大语言模型的问答方法、装置、设备及介质

大语言模型文本问答方法问答装置算法

一种基于大数据的私域电商数据搜索方法及系统

语义特征偏好特征数据搜索方法商品特征信息关键词

投放内容的标注方法、装置、存储介质及计算机设备

多模态信息图片信息处理模型标签视频

语音文本双向转换方法、装置、设备及介质

站点导航

APP 下载