摘要
本公开涉及人工智能技术领域,尤其涉及一种基于工具增强的大语言模型的多模态处理方法及装置,方法包括获取待处理用户请求,待处理用户请求用于指示需要处理的多模态任务以及各多模态任务处理所需的多模态数据,对多模态任务进行任务拆解,得到任务拆解结果,根据任务拆解结果,在预设的工具图中进行搜索得到所有可行方案,并对所有可行方案进行评估得到目标方案,利用各目标工具执行对应的子任务,得到针对各子任务的工具执行结果,根据待处理用户请求、目标方案、各工具执行结果确定出对应待处理用户请求的处理结果。根据本公开实施例提供的基于工具增强的大语言模型的多模态处理方法及装置能够实现高效精准的多模态处理。
技术关键词
宽度优先搜索
深度优先搜索
节点
多模态
非易失性计算机可读存储介质
计算机程序指令
关系
数据
人工智能技术
处理器
样本
图像处理
模块
存储器
电子设备
规划
语音
视频
系统为您推荐了相关专利信息
图像篡改检测方法
RGB特征
检测文档图像
文档图像数据
全局平均池化
报告自动生成方法
图像编码器
多模态
视觉特征
样本
运输路径优化方法
节点
模拟退火算法
邻域
配送路径优化
感知决策方法
多节点
阵列
四足机器人
工作状态信息