摘要
本发明涉及一种双录音视频文件质检方法,其特征在于包括以下步骤:对双录音视频文件创建质检任务要求;对双录音视频文件进行媒体质量检测及全局常规质检;通过人工智能方法,基于质检任务要求对双录音视频文件中与质检任务要求中相关的对话业务发生的时间点以及业务类型进行自动打点,并生成对话检测事务;在所述对话检测事务中,根据质检任务要求,通过多模态技术,进行对话的应答确认,从而实现业务质检。本发明的优点在于:很大程度上适配了双录业务流程,以自动打点结果生成对话检测事务并通过多模态技术进行检测,实现了对双录主要业务场景覆盖,减少了前置环节的输入,可较高程度代替人工质检,大大加快了质检速度,提升了质检效率和质量。
技术关键词
质检方法
自动语音识别
多模态技术
文本
搜索算法
人工智能方法
光学字符识别技术
可读存储介质
自然语言
键值
关键字
图像
索引
计算机
媒体
序列
语义
音视频
音频
坐标
系统为您推荐了相关专利信息
视觉特征
关系提取方法
融合特征
多模态特征
交叉注意力机制
元素
信息处理方法
图片
非易失性计算机可读存储介质
计算机程序指令
查询改写方法
大语言模型
文档检索系统
多任务
数据
标签分类方法
样本
更新模型参数
分类器
定义标签