摘要
本申请实施例提供了一种基于强化学习的信息检索方法和装置、电子设备及介质,属于金融科技和人工智能技术领域。该方法包括:对业务检索指示信息进行知识检索,通过检索行为及奖励因子对编码检索信息进行检索行为价值识别,得到检索行为价值;根据检索行为价值识别编码检索信息的检索停止条件;基于检索停止条件和编码检索信息生成目标检索数据。本申请实施例通过对业务检索指示信息进行知识检索,能够初步匹配到检索指示最相关的知识信息,并根据检索行为价值确定检索停止条件,并基于检索停止条件生成目标检索数据,能够确定检索时最优的停止点,实现了动态调整检索策略,并生成高质量数据的输出,显著提高了信息检索的准确率。
技术关键词
信息检索方法
因子
信息检索装置
电子设备
数据
识别模块
检索策略
可读存储介质
分词
人工智能技术
编码模块
参数
处理器
存储器
计算机
注意力
序列
系统为您推荐了相关专利信息
深度图
超分辨率网络
特征提取模块
多模态
多尺度特征融合
数据库服务器
分布式数据库
分布式锁
子模块
策略
大脑结构
多尺度特征
弥散加权图像
矩阵
功能磁共振数据
人体尺寸测量方法
接触式
三维模型
摄影设备
复制器
反馈控制量
前馈控制器
反馈控制器
复合控制方法
参数