摘要
本发明涉及语音处理技术领域,可应用于金融科技及医疗健康等业务场景中,公开了一种基于环境声音特征的真实性分析方法、装置、设备及介质,包括:获取包含环境声音的原始语音数据,对原始语音数据进行语音分离处理以生成环境声音数据和纯净语音数据,分析环境声音数据并检索其关联的知识信息,识别纯净语音数据的内容以生成对话文本数据,将环境声音特征、知识信息、对话文本数据和用户声明信息输入分析模型,输出真实性分析结果。本发明通过将环境声音数据与语音内容进行分离处理并分别提取其可用特征,结合背景知识与用户声明信息在统一分析模型中进行融合推理,能够提升真实性判断的准确性和对复杂场景的适应能力。
技术关键词
输入分析模型
分析方法
数据
生物声学
文本
能量分布特征
语义向量
多模态
掩码矩阵
声纹特征
声学特征
分析模块
信息编码
背景噪声
空间分布信息
分析装置
短时傅里叶变换
频段
语音采集模块
系统为您推荐了相关专利信息
三维形态学
算法模型
深度学习技术
注意力机制
网络架构
时间序列影像
时空滤波方法
时间序列遥感影像
遥感时间序列数据
时序
高通量检测方法
微流控芯片
微流控通道
血液
疾病
大语言模型
车辆轨迹数据
模型训练方法
转换器模块
轨迹预测装置