一种基于文本描述的不可见物体4D人物交互生成方法

AITNT
正文
推荐专利
一种基于文本描述的不可见物体4D人物交互生成方法
申请号:CN202510565049
申请日期:2025-04-30
公开号:CN120491813A
公开日期:2025-08-15
类型:发明专利
摘要
本发明提供一种基于文本描述的不可见物体4D人物交互生成方法,包括阶段一,3D人‑物体交互关键帧恢复:通过人体运动模型获取人体运动序列并均匀降采样,提取关键帧;对每个关键帧通过SMPL‑X模型重建人体网格并提取顶点位置,形成人体点云;物体位置锚定网络以人体点云、物体模板点云和文本提示为输入预测物体位置,生成3D人‑物体交互关键帧;阶段二,4D人‑物体交互序列生成:构建接触感知扩散模型,以稀疏的3D人‑物体交互关键帧为输入,通过接触感知编码器提取条件信号;基于条件信号,通过接触感知扩散模型对3D人‑物体交互关键帧进行时序插值,生成时序连贯的稠密4D人‑物体交互序列。本发明实现对未见物体的自然逼真4D人物‑物体交互合成。
技术关键词
关键帧 物体 人体运动模型 重建人体 交互注意力 序列 生成方法 感知特征 点云 文本 时序 交叉注意力机制 编码器 网格 计算机存储介质 模板 处理器 信号
系统为您推荐了相关专利信息
1
地震情景下室内非结构化部件运动虚拟仿真方法
非结构化部件 虚拟仿真方法 地震 情景 加速度
2
一种基于三维高斯的透明物体逆渲染方法和装置
基元 物体 多边形网格 探针 查询算法
3
基于深度约束的三维高斯相机运动模糊去除方法
相机 深度图 关键帧 轨迹模拟方法 图片
4
基于数学形态学特征的输电线路图像识别方法及系统
输电线路图像识别 数学形态学 形态学特征 鸟巢 杆塔
5
一种基于深度学习的空间实时重建方法
动态背景 增量式地图更新方法 三维模型 条件随机场 深度值
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号