摘要
本发明公开一种面向大语言模型的上下文感知层次指令学习方法及装置,涉及人工智能技术领域。方法包括:对初始训练数据区分大语言模型的指令角色,根据指令角色构建训练数据;对训练数据中的指令角色构建指令角色标记,根据指令角色标记、指令段分割嵌入和指令段查询嵌入,确定指令段分割特征和指令段查询特征;将指令段分割特征、指令段查询特征以及Token嵌入特征输入上下文感知模块,得到样本输入数据;将样本输入数据输入大语言模型,对答复模型进行监督微调训练,得到训练好的答复模型;将待回复文本输入到训练好的答复模型中,得到对话回复数据。采用本发明,可以提升大语言模型对关键角色指令的执行优先程度,保证对话应用的安全性和稳定性。
技术关键词
指令学习方法
大语言模型
查询特征
嵌入特征
计算机可读取存储介质
数据
标记
计算机可读指令
样本
学习设备
学习装置
文本
交叉注意力机制
模块
融合特征
层级
人工智能技术
序列
系统为您推荐了相关专利信息
智能问答系统
大语言模型
答案
数据存储系统
数据采集模块
兴趣
大语言模型
控件
数据显示单元
计算机程序产品