基于跨模态联合表示和时间序列分析的AI数字人构建方法和装置

正文

推荐专利

申请号：CN202510700969

申请日期：2025-05-28

公开号：CN120563687A

公开日期：2025-08-29

类型：发明专利

摘要

本发明公开了一种基于跨模态联合表示和时间序列分析的AI数字人构建方法和装置。采集用户面部表情与语音，将采集后的表情和语音进行特征提取，并为表情和语调打上情感类型标签；针对文本，使用关键词提取技术确定文本内容的关键主题；将照片与语音内容进行文本描述，由CLIP模型生成照片与语音的CLIP向量，对向量进行平均加权平均得到联合表示向量。通过对用户、时间、情感、话题和联合表示向量进行记录，生成用户画像。在下一次会话时候重复该过程，并对画像进行更新，每隔15天进行一次数据采集，根据时间序列预测下一次的情感基调与可能话题。与现有技术相比，本发明实现数字人语调、情感基调及话题风格的智能调整，增强交互的连续性与个性化体验。

技术关键词

话题关键词文本编辑器跨模态标签面部会话生成用户画像图像编辑器照片序列 LSTM模型关键词提取技术语音特征提取 BERT模型风格

系统为您推荐了相关专利信息

一种插件式软件平台开发方法

软件平台开发方法插件式对称加密算法数据处理中心轻量级通信协议

一种免疫固定电泳图像中M蛋白的智能分型方法及系统

神经网络模型免疫固定电泳多尺度特征融合胶片扫描阶段

一种基于双路径卷积混合编码增强的心脏分割方法

心脏分割方法拉普拉斯像素点影像滤波算法

一种基于预训练SAM大模型的水位识别方法和系统

水尺水位识别方法图像分割像素点代表

基于肠道菌群数据和深度学习的帕金森病预测方法及系统

深度神经网络模型帕金森病患者训练数据量样本健康对照

基于跨模态联合表示和时间序列分析的AI数字人构建方法和装置

站点导航

APP 下载