基于大语言模型和强化学习的决策支持系统及方法

正文

推荐专利

申请号：CN202411639883

申请日期：2024-11-18

公开号：CN119150913A

公开日期：2024-12-17

类型：发明专利

摘要

本申请涉及强化学习技术领域，提供了一种基于大语言模型和强化学习的决策支持系统及方法，其首先获取强化学习的源状态表征，并利用外部知识库对其进行数据增强，随后将增强后的状态表征转换为预设大语言模型的状态表征，接着将该状态表征输入预设大语言模型以生成强化学习智能体增强的状态表征函数和内在奖励函数，基于这两个函数更新维护利普西茨数组，以产生满足平滑条件的状态表征，最后，将满足条件的状态表征输入分类器决策模型，得出决策结果。这样，通过引入外部信息，有助于提升强化学习的源状态表征质量，从而提高智能体的决策能力和适应性。

技术关键词

编码向量语义大语言模型决策支持方法条目决策支持系统转换器结构隐式特征 Sigmoid函数分类器决策强化学习技术自然语言数据收集模块矩阵度量

系统为您推荐了相关专利信息

多语言文本自适应配置方法和电子设备

策略文本多语言容器语义

对植物进行三维重建的方法及系统、电子设备、存储介质

识别植物三维重建模型颜色图像重建注意力机制

用於使用张量网络压缩大语言模型的系统和方法

大语言模型网络

一种程序优化方法、装置、电子设备和存储介质

代码转换程序优化方法语句前馈神经网络节点

经络穴位演练方法、装置、系统及电子设备

穴位信息展示区域大语言模型图像用户界面演练方法

基于大语言模型和强化学习的决策支持系统及方法

站点导航

APP 下载