一种即插即用的语义特征解耦方法

正文

推荐专利

一种即插即用的语义特征解耦方法

申请号：CN202510484084

申请日期：2025-04-17

公开号：CN120339467A

公开日期：2025-07-18

类型：发明专利

摘要

本发明公开了一种即插即用的语义特征解耦方法，包括：利用包含大规模音频‑文本对齐数据的大型音频文本语料数据库训练 Wav2Sem 模块，使其能够学习音频语义特征并解耦近音词之间的语义信息；将 Wav2Sem 模块插入现有的自监督预训练音频编码器；使用新音频编码器替换现有语音驱控框架中的音频编码器，并对新编码器进行训练；利用训练后的新音频编码器对输入语音信号进行特征提取，生成时间序列特征，并映射到三维面部模型的参数空间，最终驱动虚拟人脸部动画。根据本发明技术方案，解决了现有技术中因语音特征耦合而导致的唇形生成不准确和不自然的问题。

技术关键词

解耦方法音频编码器时间卷积网络特征提取模块语义特征提取时间序列特征短时特征文本注意力机制说话人身份前馈神经网络动画音频特征语音特征面部

系统为您推荐了相关专利信息

一种基于大数据的算力配置检测方法及系统

时间序列特征空闲时间预测系统日志特征提取模型配置检测方法

一种用于无人机场景的无监督图像分割模型及分割方法

无人机场景图像分割模型监督图像分割方法特征提取模块图像编码器

一种自适应指代表达理解方法、系统及存储介质

多模态特征视觉特征提取矩阵图像文本编码器

一种基于图像的耕地保护检测方法、系统、设备及程序

耕地卷积特征提取风格保护检测系统矩阵

一种数字终端用控制装置及方法

协同算法多模态调控策略环境参数信息能耗

一种即插即用的语义特征解耦方法

站点导航

APP 下载