多模态融合驱动的智能体交互方法及系统

正文

推荐专利

多模态融合驱动的智能体交互方法及系统

申请号：CN202510876144

申请日期：2025-06-27

公开号：CN120781282A

公开日期：2025-10-14

类型：发明专利

摘要

本发明提供多模态融合驱动的智能体交互方法及系统，涉及智能交互技术领域，包括通过深度神经网络提取图像、文本和音频特征向量，采用跨模态自注意力子模块和模态间交互注意力子模块进行自适应融合，基于差异度更新智能体知识图谱的节点特征并进行关系推理，生成交互策略控制智能体执行交互动作。本发明实现了多模态信息的有效融合和知识图谱的动态更新，提高了智能体交互的准确性和适应性。

技术关键词

文本特征向量交互注意力图像特征向量智能体交互模态特征子模块节点控制智能体深度神经网络多模态跨模态图谱交互动作策略计算机程序指令特征提取网络音频分层强化学习智能交互技术

系统为您推荐了相关专利信息

基于多模态动态提示与时空稀疏化的视频动作定位方法

视频深度学习模型动作定位方法多模态文本特征向量

一种基于多模态大模型的无人机视觉检索与指令反馈方法

指令反馈方法无人机视觉多模态文本特征向量无人机控制系统

一种历史文化导向的空间分类与再生方法及系统

语义图谱数据深度特征提取节点再生方法

基于环视非对称编码器的点云全景分割方法、设备及介质

三维激光雷达点云交互注意力点云图像全景分割方法压缩特征

面向视听不同步场景的多模态深度伪造检测方法及系统

视觉特征模态特征听觉视听注意力机制

多模态融合驱动的智能体交互方法及系统

站点导航

APP 下载