一种高精度中文命名实体抽取模型的构建方法

AITNT
正文
推荐专利
一种高精度中文命名实体抽取模型的构建方法
申请号:CN202510750054
申请日期:2025-06-06
公开号:CN120781838A
公开日期:2025-10-14
类型:发明专利
摘要
本发明涉及一种高精度中文命名实体抽取模型的构建方法,包括以下步骤:通过基于Transformer的双向编码Bert预训练语言模型,将句子中的每个字转化为低维的字向量序列;将得到的字向量序列输入到提取词特征信息的Lattice结构层,并对BiLSTM输出的文本标签进行信息序列标注和分割,输入到进行全局归一化处理的CRF层。使用逐位相加的方式对除尾部字符的内部进行融合,再与尾部字符进行向量拼接,用线性映射转化为字向量序列同样的维度。最后将获取的多个关系以三元组的格式存储在Neo4j图数据库中。本发明可以提高字向量语义表示的准确性,有利于充分利用字词特征信息,提高中文命名实体识别的准确性。
技术关键词
中文命名实体 序列 BiLSTM模型 全局最优化 训练语言模型 标签 字符 词特征 双向长短期记忆网络 sigmoid函数 三元组 关系抽取模型 维特比算法 条件随机场 文本 索引 词典 状态更新
系统为您推荐了相关专利信息
1
采用激光粉末床技术制备高强度不锈钢的控制方法
非线性 高强度不锈钢 时序 消息传递网络 粉末床
2
一种风力发电机传动链故障诊断方法及系统
故障特征 故障振动信号 频段 粒子群算法 样本
3
用于大气污染监测的异常数据处理系统
序列 大气污染监测 时序 数据处理系统 曲线
4
基于人工智能的供应关系管理方法
关系管理方法 语义特征 序列 资料 文本
5
一种航空航天复合材料损伤可视化特征提取方法
航空航天复合材料 特征提取方法 损伤特征 深度学习网络模型 X射线图像数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号