摘要
本发明提出了一种场景适配的数字人行为预测方设备和存储介质,方法包括:本发明涉及采集文本、语音、图像等多模态用户交互数据,并进行预处理。通过预训练的多模态特征提取模型,提取出多模态特征向量。接着,使用预训练的场景识别模型和行为预测模型,预测数字人在不同场景下的行为。为了提高预测的准确性,本发明采用迁移学习技术,根据历史和当前数据差异优化模型参数或结构。同时,实时收集用户反馈,迭代更新预测模型以满足不同用户群体的需求。这种适应性方法不仅提高了数字人行为预测的精确度,还增强了其对不同场景的理解和适应能力,从而提供更智能化和人性化的服务。
技术关键词
多模态用户交互
迁移学习策略
情感特征
视觉特征
语义特征
场景
数据
特征提取模型
适应性方法
迁移学习技术
人脸识别模型
ReLU函数
语音识别模型
表达式
矩阵
文本
处理器
注意力机制
系统为您推荐了相关专利信息
局部视觉特征
放行方法
人脸特征向量
ROI图像
特征提取模型
移动性预测方法
语义特征
网格
历史轨迹数据
大语言模型
综合语义
语义特征提取
风格图像生成方法
融合特征
文本