一种序列标注优化方法、系统、计算机设备及介质

AITNT
正文
推荐专利
一种序列标注优化方法、系统、计算机设备及介质
申请号:CN202510069995
申请日期:2025-01-16
公开号:CN119990139B
公开日期:2025-10-24
类型:发明专利
摘要
本发明提供了一种序列标注优化方法、系统、计算机设备及介质,属于计算机应用及自然语言处理技术领域。该方法包括以下步骤:S1、对文本数据集进行预处理,构建预处理后的数据集;S2、获取预处理后的数据集中的词向量;S3、将获取的词向量同时输入到标签分类器和两个不同的偏移量分类器中,分别获取标签序列和偏移量序列;S4、基于获取的标签序列提取实体跨度集;S5、基于获取的偏移量序列,进行平滑处理,平滑偏移量序列中的噪声,并提取候选跨度集;S6、通过交并比策略过滤掉低质量的候选跨度,得到过滤后的候选跨度;S7、基于过滤后的候选跨度,更新标签序列中的相应实体跨度。本发明可以提高命名实体识别的准确性。
技术关键词
跨度 序列 分类器 标签 BiLSTM模型 多层感知机 计算机设备 数据 滑动窗口 命名实体识别 策略 噪声 过滤模块 文本 语义特征 解码模块 自然语言 处理器
系统为您推荐了相关专利信息
1
面向视听不同步场景的多模态深度伪造检测方法及系统
视觉特征 模态特征 听觉 视听 注意力机制
2
一种跨会话运动想象脑电信号分类识别方法
识别方法 注意力 全局平均池化 双线性插值方法 卷积模块
3
基于改进人工鱼群算法的概率积分法模型参数反演方法
概率积分法 人工鱼群算法 参数反演方法 公告牌 煤矿地质灾害防治
4
一种融合行人属性的拥挤场景行人检测系统的构建方法
行人属性识别 行人检测系统 拥挤场景 行人检测模型 注意力
5
基于AI优化的端交换方法及系统
自然语言模型 分段 文本 行业专用 预训练模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号