语音分析方法、装置、计算机设备及可读存储介质

正文

推荐专利

申请号：CN202511056279

申请日期：2025-07-29

公开号：CN121034310A

公开日期：2025-11-28

类型：发明专利

摘要

本申请涉及语音处理技术领域，提供了一种语音分析方法、装置、计算机设备及可读存储介质，包括：获取预设的业务场景中待分析的对话语音，生成预处理后的语音数据；将预处理后的语音数据转化为文字信息，并提取语音数据的声学特征和文本特征；根据声学特征和文本特征获取基础语言理解和模式识别能力，根据业务场景对应的少量标注样本数据对基础语言理解和模式识别能力进行优化；根据优化后的声学特征和文本特征生成对话特征表示，并对特征表示进行分析，生成业务场景对应的智能决策，完成对对话语音的分析。通过声学与文本特征的深度耦合突破传统语音识别的浅层应用，为金融、医疗健康养老等领域提供了“小数据驱动精准决策”的通用技术路径。

技术关键词

声学特征模式识别语音分析方法文本频谱特征韵律特征数据计算机设备决策深度神经网络架构业务场景构建回声消除技术推荐算法噪声抑制算法语义分析方法时序依赖关系

系统为您推荐了相关专利信息

一种基于BERT模型和KNN半监督学习的少样本文本分类方法

文本分类方法 BERT模型样本标签重构

一种斜拉索单、多模态涡激振动自动识别方法

自动识别方法短时傅里叶变换多模态振动加速度信号斜拉索

基于外观语义和运动幅度的视频异常检测方法及系统

视频异常检测方法词嵌入向量编码特征二分类器图像编码器

一种基于多模态的合同问答方法

问答方法多模态问答系统数据决策

一种检索增强生成的方法

多层感知机自然语言信息检索文本训练语言模型

语音分析方法、装置、计算机设备及可读存储介质

站点导航

APP 下载