一种基于大语言模型和强化学习的数学孪生体构建方法

正文

推荐专利

申请号：CN202410868958

申请日期：2024-07-01

公开号：CN118862642A

公开日期：2024-10-29

类型：发明专利

摘要

本发明实施例提供了一种基于大语言模型和强化学习的数学孪生体构建方法。该方法包括：训练一个用于生成奖励函数的大型语言模型LLM，该LLM通过微调和基于交互反馈的强化学习技术，从人类奖励中改进并受益；生成初始奖励函数，利用GPU加速的虚拟环境和组件定义，自动化筛选构建奖励函数；通过迭代进化，从LLM中采样多个独立的奖励函数输出，执行上下文奖励突变，并根据文本反馈提出改进的奖励函数；反思奖励函数，利用LLM的指令遵循和上下文改进能力，根据策略训练的文本摘要来修改现有奖励代码；进行全局优化，通过多次独立随机重启，选择最佳的奖励函数作为最终解。本方法对孪生体机理模型体系构建起到有效补充，从而更快更准确构建数字孪生体。

技术关键词

体构建方法大语言模型强化学习技术生成可执行数字孪生体文本数学摘要策略度函数人类数据快照定义指令序列

系统为您推荐了相关专利信息

文本对抗样本生成方法、装置、设备、存储介质及程序产品

样本生成方法大语言模型文本人工智能信息安全技术数据

一种基于大语言模型的保险风险监测系统

风险监测系统数据项大语言模型风险评估值冗余

一种基于硬提示的全域图数据统一图建模方法

大语言模型建模方法数据自然语言标签标准化

基于生成式大语言模型的旋转机械智能运维诊断方法

大语言模型更新词库资料诊断方法旋转机械状态

一种关系型数据库的自然语言查询方法及系统

自然语言查询方法自然语言查询系统关系型数据库大语言模型关键字

一种基于大语言模型和强化学习的数学孪生体构建方法

站点导航

APP 下载