摘要
本申请公开了一种多模态面试培训方法、装置、设备及存储介质,涉及多模态信息处理技术领域。该方法包括:分别根据当前面试者的当前视觉数据、当前文本数据和当前语音数据进行情感状态分析,得到当前面试者的初始面试结果;其中,初始面试结果包括视觉模态结果、文本模态结果和语音模态结果;对视觉模态结果、文本模态结果和语音模态结果进行融合,得到当前面试者的融合面试结果;若融合面试结果不满足面试通过条件,则从融合面试结果中筛选出当前面试者存在情感异常的至少一个异常时间戳;根据至少一个异常时间戳对应的视觉模态、文本模态和语音模态,确定多模态反馈报告。上述技术方案,通过多模态数据处理,有助于提高面试培训的全面性。
技术关键词
多模态
语音
文本
局部视觉特征
数据
时间序列特征
报告
信息处理技术
处理器
培训装置
计算机程序产品
分析模块
可读存储介质
电子设备
面部
存储器
系统为您推荐了相关专利信息
图像捕获装置
图像增强
显示高分辨率图像
显示装置
颜色校正
状态转换模型
数据校验方法
铁路联锁系统
关键字
嵌套
三维可视化模型
三维模型
位置检测方法
子宫
宫颈
行人重识别模型
特征提取网络
教师
学生
重识别方法