多模态融合特征驱动的动作控制方法、装置、设备及介质

AITNT
正文
推荐专利
多模态融合特征驱动的动作控制方法、装置、设备及介质
申请号:CN202511051744
申请日期:2025-07-29
公开号:CN120952044A
公开日期:2025-11-14
类型:发明专利
摘要
本发明涉及人工智能技术领域,可应用于具身智能、金融科技及医疗健康等业务场景中,公开了一种多模态融合特征驱动的动作控制方法、装置、设备及介质,包括:获取第一模态输入信息和第二模态输入信息,生成对应的第一模态特征向量和第二模态特征向量,融合两种模态特征向量生成多模态融合特征,基于多模态融合特征生成动作指令,结合设备当前状态、当前环境信息和任务目标生成初始动作规划,基于初始动作规划生成全局最优动作序列,控制设备执行全局最优动作序列。本发明通过多模态融合信息生成的动作指令,结合设备状态、环境信息和任务目标,生成全局最优动作序列并控制设备执行,提升复杂环境下的决策效果与动态适应能力。
技术关键词
动作控制方法 融合特征 多模态 动作控制程序 序列 生成动作 动作控制装置 规划 三维空间模型 执行设备 指令 特征提取模块 关节 音频特征 视觉特征 计算机设备 驱动信号 音频编码器 控制设备 设备控制器
系统为您推荐了相关专利信息
1
基于多模态社交网络数据的用户行为倾向分析方法及系统
倾向分析方法 多模态 因子 数据 关系
2
VEM-Token情绪同步函数分层融合的方法
记忆网络模型 序列 长短期记忆网络 注意力机制 声乐
3
一种具有智能化废液处理系统的野外口腔治疗车
废液收集装置 关键帧 废液分类装置 神经网络模型 废液收集管路
4
基于强化学习策略的大语言模型训练方法、装置和设备
语句 大语言模型 在线 语言模型训练方法 错误率
5
一种基于时频图和视觉语言模型的信号调制识别和定位方法
信号调制识别 坐标 短时傅里叶变换 视觉 多模态
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号