摘要
本申请涉及金融科技技术领域,公开了一种代答行为检测方法、装置、设备及介质。包括:利用语音识别技术获取目标视频片段对应的语音文本内容以及语音文本内容中每个字的时间戳;若语音文本内容与预设话术模板匹配,则根据时间戳对目标视频片段进行嘴巴运动检测并生成嘴巴运动检测结果;若嘴巴运动检测结果为嘴巴运动,则将语音文本内容对应的声纹数据存储至与目标事件对应的声纹库中;若嘴巴运动检测结果为嘴巴未运动,则从声纹库中获取与目标事件对应的历史声纹数据,并根据历史声纹数据对目标视频片段的目标声纹数据进行检测,得到画外人代答行为检测结果。本申请实施例可提高画外人代答行为检测的准确性。
技术关键词
运动检测
视频
文本
语音识别技术
置信度阈值
数据存储
语音活动检测
模板
金融科技技术
可读存储介质
切割单元
处理器
计算机设备
存储单元
客户
存储器
系统为您推荐了相关专利信息
语言用户界面
神经网络模型
图形用户界面
意图
人机交互方法