大语言模型的训练方法、信息交互方法、装置和存储介质

正文

推荐专利

申请号：CN202510820375

申请日期：2025-06-18

公开号：CN120804446A

公开日期：2025-10-17

类型：发明专利

摘要

本公开提供了大语言模型的训练方法、信息交互方法、装置和存储介质，涉及人工智能技术领域，尤其涉及大语言模型、智能体、深度学习、人机交互等技术领域。具体实现方案为：通过第一大语言模型确定第一样本文本的第二操作流程，并获取第一大语言模型基于第二操作流程与样本浏览器交互所得到的第二网页地址，并根据第二网页地址与第一样本文本所对应第一网页地址确定第一大语言模型与样本浏览器交互所得到的目标奖励值，并根据目标奖励值对第一大语言模型进行强化学习训练，从而使得所得到第二大语言模型准确确定出用于获取对应文本所涉及到的目标网站中的查询目标的操作流程，方便了后续基于操作流程准确获取查询目标的网页地址。

技术关键词

大语言模型文本样本信息交互方法模板信息交互装置人工智能技术数据计算机程序产品训练装置处理器通信指令输入模块输出模块可读存储介质存储器电子设备

系统为您推荐了相关专利信息

基于人工智能模型的商品分类方法及装置

商品关联信息商品分类方法多模态语义知识图谱人工智能模型

基于多参数智能协同的电源完整性自动化测试系统

自动化测试系统多参数纹波噪声复合传感器阵列近场电磁探头

合同审查方法、装置、设备、存储介质及产品

分片深度语义分析计算机程序产品关键字报告

一种多阶段融合循环神经网络的间歇过程温度预测方法

DBSCAN聚类算法温度预测方法多阶段数据融合特征

模型训练方法及用于模型训练的样本确定方法

样本模型训练方法处理器模型库场景

大语言模型的训练方法、信息交互方法、装置和存储介质

站点导航

APP 下载