摘要
本公开提供了一种基于人工智能的交互方法、装置、设备、介质、程序产品及智能体,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于AIGC基于人工智能的内容生成等场景。该方法包括:获取多模态问题,其中,多模态问题包括文本和图像;分别检索与文本和图像各自相匹配的信息,得到多源检索信息;利用多模态知识提炼大模型基于多模态问题对多源检索信息进行多任务处理,得到检索增强信息;以及利用多模态交互大模型基于多模态问题对检索增强信息进行处理,得到针对多模态问题的回复内容。
技术关键词
多模态交互
文本
检索图像
对象识别
交互方法
多模态信息
样本
推荐意图
图像特征提取
人工智能技术
计算机程序产品
交互装置
计算机视觉
处理器通信
噪声
系统为您推荐了相关专利信息
联盟区块链
交互方法
协作策略
监测策略
动态信誉
BERT模型
画像方法
企业画像
画像系统
多标签
文本分类模型
文本分类方法
计算机可执行指令
概念
聚类