一种基于场景生成数字人的方法

AITNT
正文
推荐专利
一种基于场景生成数字人的方法
申请号:CN202411099529
申请日期:2024-08-12
公开号:CN118840455A
公开日期:2024-10-25
类型:发明专利
摘要
本发明公开了一种基于场景生成数字人的方法,属于数据处理技术领域,具体包括:对图像特征以及文本特征进行提取,采用注意力机制进行跨模态检索,分别学习基于图像的区域特征和基于文本的词汇特征;采用改进的门控机制加强图像-文本的语义匹配,过滤掉不相关的信息,生成新的图像和文本;分别计算图像和文本的相似度,采用计算局部的相似性,求和平均得到图像和文本的相似度;采用最大硬度的排序损失函数对设定批量的图像-文本匹配进行训练;本发明通过采用深度学习算法、注意力机制、改进的门控机制和最大硬度的排序损失函数等技术手段,实现了基于场景生成数字人的方法,从而提高了数字人生成的质量和效率。
技术关键词
排序损失 图像 词袋模型 注意力机制 文本分类模型 深度学习算法 场景 实体 跨模态 线索 样本 词典 上下文特征 深度学习模型 数据处理技术 残差网络 序列 批量
系统为您推荐了相关专利信息
1
一种轨道交通的巡检机器人多维监测及识别方法
巡检机器人 多维监测 状态监测数据 识别方法 邻域
2
晶圆崩边检测方法、设备及存储介质
像素点 图像 分布特征 阈值分割算法 连续性
3
多商品自动校正识别方法及智能自助收银机
图像 识别方法 重力传感器 智能自助 三维模型
4
基于交互感知和地图自适应的车辆轨迹预测方法
车辆轨迹预测方法 历史轨迹数据 地图特征 图像块 交互特征
5
视频生成方法、装置、计算机设备及存储介质
图片 视频生成方法 图像生成模型 计算机设备 视频生成装置
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号