一种长时语音的多情绪感知定位方法及系统

正文

推荐专利

一种长时语音的多情绪感知定位方法及系统

申请号：CN202411454107

申请日期：2024-10-17

公开号：CN119252288B

公开日期：2025-11-25

类型：发明专利

摘要

本发明公开了一种长时语音的多情绪感知定位方法及系统，涉及人工智能技术领域，将待识别的长时语音输入到已训练完成的时序多尺度空间对偶模型中，输出所述长时语音中的多个情绪状态；时序多尺度空间对偶模型的训练过程如下：构成训练数据集；将训练数据集输入到时序多尺度SSD架构中，得到低维状态空间对偶输出、中维状态空间对偶输出和高维状态空间对偶输出；将低维状态空间对偶输出、中维状态空间对偶输出和高维状态空间对偶输出进行特征融合，将融合所得到的复杂长时多情感语音时序特征输入情绪解析模块，以预测最终的多情绪标签及时间定位信息；该多情绪感知定位方法及系统增强了多情绪识别的准确性和鲁棒性。

技术关键词

时间定位语音定位方法时序特征模块预训练模型标签人工智能技术多层感知机机制输出特征定位系统多尺度鲁棒性数据参数元素误差线性

一种长时语音的多情绪感知定位方法及系统

站点导航

APP 下载