摘要
本公开提供了基于大模型的交互方法、装置、智能体及存储介质,人工智能技术领域,尤其涉及深度学习、大模型等技术领域。基于大模型的交互方法包括:接收目标图像和目标对象输入的需求文本,需求文本表征目标对象对目标图像的处理需求;基于图像主体信息,利用大模型对需求文本进行语义理解,得到意图理解结果,图像主体信息是对目标图像进行主体识别确定的;以及基于意图理解结果确定与处理需求相匹配的回复信息,并向目标对象推送回复信息。
技术关键词
图像主体
意图
文本
交互方法
识别工具
语义
对象
输入模块
人工智能技术
计算机程序产品
交互装置
处理器通信
信息更新
指令
输出模块
交通工具
系统为您推荐了相关专利信息
动作识别模型
车辆控制方法
规划
激光雷达数据
计算机可读指令