摘要
本申请公开了面部表情识别方法、装置和设备,应用于大语言模型技术领域,方法包括:获取待测视频序列和与面部表情识别相关联的问题指令,待测视频序列包括至少一帧用户面部图像;处理至少一帧面部图像,得到至少一帧面部图像的面部特征序列,其包括面部关键点、视觉增强特征和查询嵌入特征中的至少一项,视觉增强特征为图像中增强后的与用户面部相关联的编码特征,查询嵌入特征为新增有与用户面部相关联的编码特征的自然语言特征;通过待测视频序列和问题指令来得到码本索引;根据码本索引和至少一帧面部图像的面部特征序列,结合大语言模型,得到用户的面部表情信息。本申请提高大语言模型在面部表情识别任务上的精准度和特征提取能力。
技术关键词
面部表情识别方法
面部关键点
编码特征
嵌入特征
视觉特征
面部特征
图像
序列
索引
面部表情识别装置
视频
指令
自然语言
大语言模型
语言模型技术
交叉注意力机制