多人面审的音视频识别处理方法、装置、设备及存储介质

正文

推荐专利

申请号：CN202411065847

申请日期：2024-08-05

公开号：CN119028347A

公开日期：2024-11-26

类型：发明专利

摘要

本申请公开了一种多人面审的音视频识别处理方法、装置、设备及存储介质，对待识别音视频文件进行目标话术的定位，并基于音唇同步模型统计目标话术对应的时间段内各个用户对应的嘴巴运动时长，确定在目标话术的时间段内的核心用户，再通过识别核心用户的身份属性，结合预设列表对目标话术对应文本内容进行报警判断，避免单一的音唇同步模型判断失误的情况。解决了实际场景中代理人对投保人说话并非完全指导话术，而实现对于普通话术不予报警，且由于投保人回答的话术一般很简短，音唇同步模型判断不一定准确，就会导致的误报警的情况出现的技术问题。

技术关键词

音视频音唇同步身份声纹特征声纹识别模型核心存储程序代码列表时间段文本识别标记可读存储介质大语言模型定位单元运动处理器存储器计算机场景

系统为您推荐了相关专利信息

一种汽车控制方法、装置、存储介质及设备

人脸识别模型中央控制系统汽车控制方法图像身份验证

基于多模态信息融合的视频处理方法、装置、设备及介质

语音识别文本多模态信息融合图像特征识别算法视频关键帧提取算法

一种通过RPA技术实现密码重置自动化的系统

RPA技术开发环境搭建系统集成模块 RPA机器人密码重置系统

一种可信数据空间的数据安全代理系统

关键词历史访问记录决策 TextRank算法标记

一种基于区块链的一站式医保信息处理方法、系统、电子设备及存储介质

医疗数据处理平台医院数据处理数据处理终端医疗保险数据医保信息处理技术

多人面审的音视频识别处理方法、装置、设备及存储介质

站点导航

APP 下载