摘要
本发明提供的基于大语言模型的跨模态rPPG信号感知方法、装置及电子设备,方法包括:获得人脸视频片段;从人脸视频片段中提取低精度的rPPG信号以及多尺度融合视觉特征;生成关于人脸视频片段和rPPG信号的提示信息;由大语言模型根据rPPG信号、多尺度融合视觉特征和提示信息进行预测,得到高精度的rPPG信号。本发明利用大语言模型综合rPPG信号、多尺度融合视觉特征以及与rPPG信号有关的提示信息等多种信息源进行rPPG信号预测,可以提高最终的预测精度和稳健性。
技术关键词
融合视觉特征
信号感知方法
大语言模型
多尺度
人脸
视频
语义
令牌
原型
压缩器
电子设备
深度学习模型
文本
感知装置
精度
注意力机制
模块
处理器
系统为您推荐了相关专利信息
三维角色模型
蒙皮方法
三维模型
三角形面片
关节
风险预警方法
误差反向传播
预测模型训练
计算机设备
风险预警装置
柔性直流换流站
故障决策方法
知识库构建方法
报告
设备标识信息