摘要
本申请公开了一种基于语音分离的质检方法及装置、存储介质和电子设备,涉及人工智能领域。该方法包括:接收待质检文件,待质检文件至少包括待质检音频文件;将待质检音频文件输入机器人音色识别模型,依据机器人音色识别模型获取待质检音频文件中的机器人播报音频和用户应答音频;提取机器人播报音频对应的机器人播报文本,提取用户应答音频对应的用户应答文本;依据机器人播报文本和用户应答文本,确定待质检文件的质检报告。通过本申请,解决了相关技术中混合音频的质检报告准确性较低的问题。
技术关键词
机器人
音频
文本
质检方法
意图分类模型
音色特征
语音识别模型
多模态
视频
报告
图像处理模型
电子设备
质检装置
神经网络模型
人声
样本
处理器
可读存储介质
系统为您推荐了相关专利信息
控制力矩陀螺
人形机器人
运动机构
轮毂电机控制
闭环控制器
自动语音识别
大语言模型
命名实体识别
说话人识别模型
后处理模块
特征提取方法
大语言模型
模版
格式化
文本规范化