摘要
本发明公开了一种基于场景模糊感知与推理的问答方法、装置、设备及介质,所述方法包括:获取场景的图片帧进行模糊感知,得到关键元素,关键元素包括目标对象的外观属性与空间位置;基于推理联想知识库进行推理与联想,得到派生元素,派生元素包括目标对象的功用属性,以及与该目标对象有关联的对象;根据关键元素和派生元素,得到动态场景认知;获取与场景相关的问题,并基于动态场景认知,采用大语言模型生成问题的回答;若回答不满足问题需求,则根据问题与动态场景认知确定最优感知路径,并基于最优感知路径更新动态场景认知与回答,直至更新后的回答满足问题需求,输出当前回答。本发明能够实现更高效准确的场景感知。
技术关键词
动态场景
问答方法
图片
元素
大语言模型
推理知识库
对象
语义特征
可读存储介质
问答装置
模块
处理器
计算机设备
多模态
存储器
意图
系统为您推荐了相关专利信息
动态任务调度方法
调度机器人
样本
动态任务调度系统
序列
字体
文字内容信息
特征向量库
canny边缘检测
canny算法
生成方法
数据库查询技术
智能测试技术
策略
代码覆盖率