摘要
本发明公开了一种自然语言处理任务执行及其模型训练方法、设备、介质,应用于人工智能领域。其中,方法包括获取大规模的第一自然语言模型、小规模的第二自然语言模型及文本数据集。利用第一自然语言模型对文本数据集各文本数据进行处理,生成基于问题文本得到正确答案文本的逻辑推理步骤文本数据及解释错误答案文本的纠错步骤文本数据。基于文本数据集、逻辑推理步骤文本数据及纠错步骤文本数据,生成逻辑推理文本数据集;利用逻辑推理文本数据集训练第二自然语言模型,利用训练好的第二自然语言模型执行自然语言处理任务。本发明可以解决相关技术学生模型无法达到教师模型相匹配的性能的问题,能够有效提升自然语言处理任务的执行精度。
技术关键词
自然语言模型
答案
标记
生成方式
数据
人机交互界面
非易失性存储介质
模型训练方法
纠错文本
模版
训练语言模型
执行器
处理器
计算机程序产品
移动设备
显示屏
小规模
系统为您推荐了相关专利信息
传感元件
对接装置
主控单元
输入模块
人机交互面板
干扰识别模型
支付管理方法
特征点集合
对抗网络模型
图像
虚拟电厂系统
多层次
在线学习方法
网络拓扑结构
全局优化算法
关节点
姿态特征
网络
三维人体姿态
三维人体形状
图片类别
屏幕
计算机执行指令
指标
应用程序用户界面