一种语音质检方法、装置、计算机设备及存储介质

正文

推荐专利

申请号：CN202510865267

申请日期：2025-06-25

公开号：CN120690231A

公开日期：2025-09-23

类型：发明专利

摘要

本申请公开一种语音质检方法、装置、计算机设备及存储介质，属于人工智能技术领域，应用于金融、健康医疗养老等领域的语音质检场景。本申请通过引入多模态特征融合技术，通过提取文本的上下文语义特征和语音的声学特征，并结合预训练情绪识别模型获取情绪特征，实现从语义、声学和情绪三个维度对语音数据的全面理解，通过对三类特征向量进行深度融合，能够更充分地挖掘语音中的质量问题，相较于传统仅依赖文本或声学特征的方法，本申请在文本或声学特征的基础上结合情绪特征实现多模态特征，能够更全面、细致地反映语音内容所蕴含的信息，从而提升语音质检的准确率与实用性，满足智能客服、语音审计等应用场景对高质量自动质检的需求。

技术关键词

语音质检方法情绪识别模型质检模型多模态特征融合计算机可读指令文本分析器上下文语义信息语音声学特征情绪特征计算机设备预训练语言模型数据自动质检医疗养老识别模块

系统为您推荐了相关专利信息

基于二次聚类的工业用户可调节潜力预测方法及系统

潜力预测方法工业计算机可读指令日负荷曲线潜力预测技术

一种图像风格转换方法及设备

图像风格转换方法点云特征视觉特征语义特征计算机可读指令

图像采集方法、装置、计算机设备及存储介质

图像采集方法数据传输线控制芯片信号线计算机可读指令

一种基于AI视觉的紧急呼叫系统、方法、设备及存储介质

乘员紧急呼叫系统车辆控制系统视觉算法紧急呼叫方法

一种基于多模态时空特征融合的武术动作评分与识别方法

识别视频数据编码器识别方法多模态特征融合时间序列特征

一种语音质检方法、装置、计算机设备及存储介质

站点导航

APP 下载