摘要
本申请一些实施例示出一种知识嵌入强化学习方法及模型推理方法,强化学习方法包括:将标注有输出标签的第一输入信息添加到第一数据集中,第一输入信息包括第一文本及其中已知实体对应的知识标签;将标注有输出标签的第二输入信息添加到第二数据集中,第二输入信息包括第二文本及其中虚构未知实体对应的知识标签;将标注有输出标签的第三输入信息添加到第三数据集中,第三输入信息包括第三文本及与其中虚构未知实体对应的上下文提示文本;利用第一数据集、第二数据集和第三数据集训练预设语言模型。本申请通过虚构未知实体及其知识标签和上下文提示文本,优化模型的训练语料,强化模型应对先验知识之外实体的判断能力,提升识别准确率。
技术关键词
标签
文本
实体
强化学习方法
数据
生成输出信息
推理方法
语义理解模型
字符
显示器
显示设备
终端设备
控制器
意图
频率
系统为您推荐了相关专利信息
广告系统
服务端
广告方法
区块链共识机制
非暂态计算机可读存储介质
多时间尺度
智能巡检系统
时序
温度敏感点
智能巡检方法
表达腺病毒
肺动脉高压治疗
肺动脉高压疾病
小鼠
低氧培养箱
图纸
生成方法
多模态
自然语言
非暂态可读存储介质