基于检索增强生成的具身场景问答方法、装置及电子设备

正文

推荐专利

申请号：CN202411700553

申请日期：2024-11-26

公开号：CN119179770B

公开日期：2025-12-16

类型：发明专利

摘要

本申请公开了一种基于检索增强生成的具身场景问答方法、装置及电子设备，属于人工智能技术领域。方法包括：从场景图中匹配满足问题信息的目标对象；根据目标对象在场景图中的视觉信息生成目标对象的场景描述信息；将场景描述信息和问题信息输入至语言模型中，得到语言模型输出的针对问题信息的回复信息。本申请实施例基于检索增强技术通过从场景图中检索出与问题相关的目标对象，然后将目标对象在场景图中的视觉感知信息转换为自然语言信息，并将这些信息作为语言模型的上下文输入，以增强语言模型对问题信息的理解和回答能力，即使遇到需要复杂推理的问答，也可以得到更加准确地答案，从而提高问答的准确性。

技术关键词

场景三元组对象问答方法非暂态计算机可读存储介质自然语言信息视觉实体电子设备问答装置人工智能技术处理器答案匹配模块输入模块关系存储器模板程序

系统为您推荐了相关专利信息

一种测试案例生成方法、设备、介质及产品

测试案例生成方法格式模板模型预测值资产金字塔模型

基于误差反馈与模型动态优化的风电短期功率预测方法

优化场景风电集群模型超参数样本

一种基于大模型的交互前端GUI自动布局方法及装置

自动布局方法自动布局装置深度强化学习算法监督学习算法多任务

一种数字孪生模型构建方法

数字孪生模型 SPARQL查询服务器主机样本 DBSCAN密度聚类

一种新型的协同进化多目标优化方法

聚类算法协同进化算法分布估计算法集合策略停滞现象

基于检索增强生成的具身场景问答方法、装置及电子设备

站点导航

APP 下载