摘要
本申请提供了一种诗词实体提取模型的训练方法、诗词实体提取方法和设备,该方法包括将初始诗词训练集中的第一诗词文本信息输入至预训练模型,输出第一诗词文本信息中每个命名实体所对应的第一实体类型标签;计算第一诗词文本信息与预设知识库中每个待筛选诗词文本信息之间的余弦相似数据和诗词平仄差异数据;针对每个待筛选诗词文本信息,根据余弦相似数据和诗词平仄差异数据,生成综合相似度;在综合相似度满足第一预设条件的情况下,将待筛选诗词文本信息确定为与第一诗词文本信息对应的第二诗词文本信息;将中间诗词训练集输入至预设语言模型,得到目标诗词训练集;利用目标诗词训练集对预训练模型进行训练,得到经训练的诗词实体提取模型。
技术关键词
文本
语义向量
实体提取方法
预训练模型
训练集
标签
门控循环网络
位置编码信息
多头注意力机制
数据
感知特征
序列标注方法
矩阵
度函数
处理器
时序
解码
系统为您推荐了相关专利信息
SysML模型
扩展模块
大语言模型
软件
生成测试数据
植被净初级生产力
遥感预测方法
沼泽湿地植被
模型训练模块
气象
趋势分析方法
Stacking集成学习
融合特征
遗传算法优化
大数据