一种基于场景生成数字人的方法

正文

推荐专利

一种基于场景生成数字人的方法

申请号：CN202411099529

申请日期：2024-08-12

公开号：CN118840455A

公开日期：2024-10-25

类型：发明专利

摘要

本发明公开了一种基于场景生成数字人的方法，属于数据处理技术领域，具体包括：对图像特征以及文本特征进行提取，采用注意力机制进行跨模态检索，分别学习基于图像的区域特征和基于文本的词汇特征；采用改进的门控机制加强图像－文本的语义匹配，过滤掉不相关的信息，生成新的图像和文本；分别计算图像和文本的相似度，采用计算局部的相似性，求和平均得到图像和文本的相似度；采用最大硬度的排序损失函数对设定批量的图像－文本匹配进行训练；本发明通过采用深度学习算法、注意力机制、改进的门控机制和最大硬度的排序损失函数等技术手段，实现了基于场景生成数字人的方法，从而提高了数字人生成的质量和效率。

技术关键词

排序损失图像词袋模型注意力机制文本分类模型深度学习算法场景实体跨模态线索样本词典上下文特征深度学习模型数据处理技术残差网络序列批量

系统为您推荐了相关专利信息

一种轨道交通的巡检机器人多维监测及识别方法

巡检机器人多维监测状态监测数据识别方法邻域

晶圆崩边检测方法、设备及存储介质

像素点图像分布特征阈值分割算法连续性

多商品自动校正识别方法及智能自助收银机

图像识别方法重力传感器智能自助三维模型

基于交互感知和地图自适应的车辆轨迹预测方法

车辆轨迹预测方法历史轨迹数据地图特征图像块交互特征

视频生成方法、装置、计算机设备及存储介质

图片视频生成方法图像生成模型计算机设备视频生成装置

一种基于场景生成数字人的方法

站点导航

APP 下载