摘要
本公开提供了大语言模型的训练方法、信息交互方法、装置和存储介质,涉及人工智能技术领域,尤其涉及大语言模型、智能体、深度学习、人机交互等技术领域。具体实现方案为:通过第一大语言模型确定第一样本文本的第二操作流程,并获取第一大语言模型基于第二操作流程与样本浏览器交互所得到的第二网页地址,并根据第二网页地址与第一样本文本所对应第一网页地址确定第一大语言模型与样本浏览器交互所得到的目标奖励值,并根据目标奖励值对第一大语言模型进行强化学习训练,从而使得所得到第二大语言模型准确确定出用于获取对应文本所涉及到的目标网站中的查询目标的操作流程,方便了后续基于操作流程准确获取查询目标的网页地址。
技术关键词
大语言模型
文本
样本
信息交互方法
模板
信息交互装置
人工智能技术
数据
计算机程序产品
训练装置
处理器通信
指令
输入模块
输出模块
可读存储介质
存储器
电子设备
系统为您推荐了相关专利信息
商品关联信息
商品分类方法
多模态
语义知识图谱
人工智能模型
自动化测试系统
多参数
纹波噪声
复合传感器阵列
近场电磁探头
DBSCAN聚类算法
温度预测方法
多阶段
数据
融合特征