摘要
本公开涉及情绪检测方法及装置。所述方法包括:对输入视频逐帧进行标准化处理,以获得多个单帧人脸图像;对单帧人脸图像进行处理,以提取单帧人脸图像的帧级特征;识别输出视频中情绪转变的时间点,并且基于时间点对输出视频进行分段以获得多个视频子片段;针对每个视频子片段,通过时序动态适配器将相应视频子片段内的单帧人脸图像的帧级特征聚合以生成聚合视频特征;将相应视频子片段的聚合视频特征输入大语言模型以生成描述情绪状态的文本;利用文本分类回归模型对文本进行分析,以输出每个视频子片段的情绪类别及对应的情绪强度值。由此,能够精确捕捉并分析视频中面部情绪的动态变化过程,且保证了计算效率并提升了结果的可解释性。
技术关键词
单帧人脸图像
情绪检测方法
情绪检测装置
文本
大语言模型
滑动时间窗口
门控循环单元
变换器
共享适配器
时序
动态
实时视频流
序列
图像块
加权特征
强度
系统为您推荐了相关专利信息
编码向量
地址翻译方法
语义特征
序列
语义关联度
专家数据库
供电箱
仪表供电系统
仪表控制技术
开关
声学特征
语音生成模型
训练场景
生成语音
预测特征
音视频传输方法
服务器
拥塞控制技术
媒体
实时通讯