摘要
本公开提供了多模态信息的处理方法、装置、设备以及存储介质,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域。具体实现方案为:对多模态信息进行意图识别,得到该多模态信息对应的意图类别;根据该多模态信息及其对应的意图类别,得到思考过程信息;根据该思考过程信息,得到需要调用的算子信息;其中,该算子信息包括在对该多模态信息进行处理的过程中使用的应用程序的信息;根据该意图类别、该思考过程信息和该算子信息,得到该多模态信息的输出结果。
技术关键词
多模态信息
意图类别
意图识别
智能体系统
应用程序编程接口
规划
人工智能技术
计算机程序产品
计算机视觉
训练装置
处理器通信
标签
指令
输入模块
输出模块
可读存储介质
系统为您推荐了相关专利信息
动态更新系统
界面组件
事件驱动机制
智能学习模块
指令
协调控制器
拉格朗日系统
协调控制系统
多智能体系统
智能机械臂
多模态信息融合
数据扩充方法
多模态特征
生成对抗网络模型
电力设备