摘要
本发明公开了一种自然语言处理任务执行方法、装置、设备、系统、介质,应用于人工智能技术领域。方法包括为自然语言模型各注意力头设置标识其是否被保留的掩码参数。基于自然语言模型的各注意力头对应一个待训练辅助参数,生成头选择标记网络,利用自然语言训练样本数据集训练自然语言模型的过程中,同时训练头选择标记网络,基于训练好的头选择标记网络确定各注意力头的掩码参数;基于各掩码参数确定自然语言模型相对应的注意力头是被保留还是被删减,并利用删减后的自然语言模型执行自然语言处理任务。本发明可以解决相关技术影响模型性能且需要额外硬件支持的问题,无需额外硬件支持便可部署在计算资源能力有限的硬件上执行自然语言处理任务。
技术关键词
注意力
训练样本数据
参数
网络
人机交互界面
非易失性存储介质
嵌入式微处理器
训练自然语言模型
标识
标记标签
矩阵
执行器
非线性
精度
数值
系统为您推荐了相关专利信息
信息匹配方法
指数衰减函数
学习能力评估
ARIMA模型
曲线
状态评估方法
结构三维模型
实时监测数据
机械
结构健康状态
空间太阳电池阵
带卡扣
卷曲
仿真方法
非线性动力学
智能温度控制系统
连续退火工艺
无取向硅钢
分布式光纤传感网络
全息监控
轴承故障诊断方法
信号分析
对象
有效性
故障诊断测试