用于训练模型的方法、计算机可读存储介质和计算机程序产品

正文

推荐专利

申请号：CN202511081443

申请日期：2025-08-01

公开号：CN120911638A

公开日期：2025-11-07

类型：发明专利

摘要

本发明公开了用于训练模型的方法、计算机可读存储介质和计算机程序产品。一种用于训练模型的方法包括：接收训练数据集，训练数据集包括复杂指令数据和相关联的验证器；使待训练的模型基于复杂指令数据生成输出；基于验证器对输出执行混合验证，混合验证包括基于预定义规则脚本的验证和基于大语言模型裁判的语义判断；对输出执行意图检查，意图检查用于判断输出是否满足复杂指令数据中的指令的意图；以及基于意图检查的结果和混合验证的结果来更新待训练的模型的参数。根据本发明的方法克服了利用指令任务强化学习的技术导致被训练的模型对指令任务过拟合的问题，提升了指令任务强化学习过程的鲁棒性和训练效率。

技术关键词

指令意图数据生成输出大语言模型计算机程序产品检测器脚本可读存储介质蜜罐陷阱语义验证规则复杂度参数逻辑鲁棒性处理器模式

系统为您推荐了相关专利信息

基于术前影像组学及脑脊液基因组学的颅咽管瘤病理分型综合预测系统

组学特征影像分类器预测系统肿瘤

基于大数据的关系型数据库备份恢复方法及系统

多维索引结构关系型数据库分布式存储系统备份恢复方法分布式计算框架

点击率预测模型训练和商品推荐方法、设备及介质

点击率预测模型商品推荐方法编码器注意力框架

一种面向旅游场景的对话式AI多意图理解与决策方法

旅游场景决策方法语句方言词汇预训练语言模型

一种接口修复方法、设备、存储介质及程序产品

实体间关系语义向量接口序列语义功能

用于训练模型的方法、计算机可读存储介质和计算机程序产品

站点导航

APP 下载