摘要
本申请实施例提供了一种代答复识别方法和装置、计算机设备及存储介质,属于人工智能技术领域。该方法包括:从第一音视频数据提取训练视频数据,从第二音视频数据提取训练音频数据;将训练视频数据和训练音频数据进行合并处理,得到初步音视频数据;根据预设随机阈值将初步音视频数据进行音频区间调整,得到训练音视频数据;根据训练音视频数据对预设的原始代答复识别模型进行训练,得到目标代答复识别模型;获取目标音视频数据;通过目标代答复识别模型对目标音视频数据进行代答复识别。本申请可以应用于金融科技与健康医疗等需要大量数据的业务系统中,能够自动化识别代答复情况,减少代答复识别过程的人力。
技术关键词
音视频
唇部特征
发音
识别方法
拼音
计算机设备
语音
音频特征提取
序列
生成随机数
可读存储介质
人工智能技术
数据获取模块
业务系统
识别装置
处理器
系统为您推荐了相关专利信息
面向农业
空间聚类算法
识别方法
时空分布特征
预警判据
信息识别方法
语音特征
AR设备
语音识别模型
特征提取模型
音频功率放大器
低压差线性稳压电路
喂食器
电池采样电路
降压开关稳压器