基于大语言模型和强化学习的决策支持系统及方法

AITNT
正文
推荐专利
基于大语言模型和强化学习的决策支持系统及方法
申请号:CN202411639883
申请日期:2024-11-18
公开号:CN119150913A
公开日期:2024-12-17
类型:发明专利
摘要
本申请涉及强化学习技术领域,提供了一种基于大语言模型和强化学习的决策支持系统及方法,其首先获取强化学习的源状态表征,并利用外部知识库对其进行数据增强,随后将增强后的状态表征转换为预设大语言模型的状态表征,接着将该状态表征输入预设大语言模型以生成强化学习智能体增强的状态表征函数和内在奖励函数,基于这两个函数更新维护利普西茨数组,以产生满足平滑条件的状态表征,最后,将满足条件的状态表征输入分类器决策模型,得出决策结果。这样,通过引入外部信息,有助于提升强化学习的源状态表征质量,从而提高智能体的决策能力和适应性。
技术关键词
编码向量 语义 大语言模型 决策支持方法 条目 决策支持系统 转换器结构 隐式特征 Sigmoid函数 分类器决策 强化学习技术 自然语言 数据收集模块 矩阵 度量
系统为您推荐了相关专利信息
1
多语言文本自适应配置方法和电子设备
策略 文本 多语言 容器 语义
2
对植物进行三维重建的方法及系统、电子设备、存储介质
识别植物 三维重建模型 颜色 图像重建 注意力机制
3
用於使用张量网络压缩大语言模型的系统和方法
大语言模型 网络
4
一种程序优化方法、装置、电子设备和存储介质
代码转换 程序优化方法 语句 前馈神经网络 节点
5
经络穴位演练方法、装置、系统及电子设备
穴位 信息展示区域 大语言模型 图像用户界面 演练方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号