一种用于动态上下文环境中人体交互动作生成的方法

正文

推荐专利

申请号：CN202510446938

申请日期：2025-04-10

公开号：CN120411354A

公开日期：2025-08-01

类型：发明专利

摘要

本发明的技术方案是公开了一种用于动态上下文环境中人体交互动作生成的方法，在第一阶段得到了不同粒度文本信息、几何信息。第二阶段通过大规模语言模型进行文本上细粒度的优化，同时交叉注意力机制融合语言模态、几何模态的特征。扩散模型在每一步生成最终人体动作序列，并通过多层自注意力和互注意力实现特征提取。与现有技术方案相比，本发明具有以下优势：高语义一致性：通过多层次语义引导，生成符合交互语义的动作；高几何精确性：结合点云几何特征和可供性地图，避免动作与目标对象之间的几何穿透；广泛适用性：支持复杂的人物交互场景，包括人‑物、人‑人交互，以及变形对象操作。

技术关键词

人体交互动作动态上下文交叉注意力机制人体动作序列文本结合点注释系统关节特征动作列表接触点动态物体标注工具语义对象轨迹点云多层次

系统为您推荐了相关专利信息

交互方法、装置及电子设备

界面交互内容文本交互方法动作交互

多模态数据的语义分析模型推理方法、装置和计算机设备

语义分析模型特征提取网络推理方法多模态策略

基于多模态大语言模型适应度评估的场景内容生成进化方法

图像生成模型大语言模型进化方法进化算法网络架构

一种文档智能化处理的方法及装置

机器可读程序光学字符识别技术文本多轮对话场景语义匹配算法

一种基于图谱语言模型的对话型语音情感自动标注方法

情感特征文本语音情感识别模型标注方法预训练语言模型

一种用于动态上下文环境中人体交互动作生成的方法

站点导航

APP 下载