基于用户行为的多模态语音转换方法及系统

正文

推荐专利

基于用户行为的多模态语音转换方法及系统

申请号：CN202510793469

申请日期：2025-06-13

公开号：CN120783742A

公开日期：2025-10-14

类型：发明专利

摘要

本发明涉及语音识别与合成技术领域，揭露了一种基于用户行为的多模态语音转换方法及系统，包括：对骨导信号进行振动分离，得到分离振动信号，将脸肌微电流映射为肌肉形变梯度，通过隐式行为数据分析用户的意图强度；将肌肉形变梯度映射为用户的语音基频，将分离振动信号线性转换为用户的语音共振峰，基于意图强度，对非语音活动段进行噪声注入，得到噪声注入语音；通过预设的正交正则化声码器中的正交投影层构建语音基频、语音共振峰及噪声注入语音对应的用户行为语音；通过正交正则化声码器中的骨导合成层将语音特征向量与用户行为语音合成为骨导传播语音。本发明可以提升多模态语音转换技术的准确率。

技术关键词

语音转换方法非语音信号噪声意图高斯混合模型颅骨声道语音转换系统多模态语音非线性强度载波调制器电流融合特征双曲正切函数功率值分支信噪比

系统为您推荐了相关专利信息

整车仿真测试装置、方法及电子设备

接收远程控制指令收发模块车辆控件仿真测试装置

支持外部可调且内置固定最小软启动时间电路的启动方法

场效应管软启动时间栅极软启动电路信号

一种储能柜自动化装配线及其智能化系统

自动化装配线储能柜智能化系统识别模块数据采集模块

一种三相表贴式永磁电机随机混频的主动抑振方法

主动抑振方法表贴式永磁电机振动加速度传感器电流环PI调节器幅值

基于视听协同的人形机器人头部定向方法及系统

人形机器人定向系统生成警报信号时间同步图像

基于用户行为的多模态语音转换方法及系统

站点导航

APP 下载