一种数据稀缺条件下多领域实体识别方法、装置及可读介质

AITNT
正文
推荐专利
一种数据稀缺条件下多领域实体识别方法、装置及可读介质
申请号:CN202510387793
申请日期:2025-03-31
公开号:CN120471056A
公开日期:2025-08-12
类型:发明专利
摘要
本发明公开了一种数据稀缺条件下多领域实体识别方法、装置及可读介质,包括:确定目标命名实体识别任务所需的目标实体类别集合;基于每个原始数据集和目标实体类别集合标注出每个原始数据集的文本数据集合的文本中其余未标注的实体的伪标签;利用经预训练的第一大语言模型和目标实体类别集合对每个原始数据集的文本数据集合的文本中其余未标注的实体的伪标签进行打分和过滤,保留高置信度的伪标签及其相应的文本并与对应的原始数据集结合生成最终数据集;利用最终数据集对经预训练的第二大语言模型进行微调,得到目标命名实体识别任务对应的实体识别模型并识别出待识别的文本中的实体及其对应的实体类别。本发明提高实体识别的准确性和适用性。
技术关键词
文本 实体识别方法 实体识别模型 大语言模型 命名实体识别 数据 标签 处理器 计算机程序产品 过滤模块 识别模块 存储装置 可读存储介质 电子设备 语义
系统为您推荐了相关专利信息
1
一种可成长的虚拟数字人方法、系统及产品
工作流引擎 工作流实例 意图识别 自动语音识别 文本
2
一种基于增强提示学习与图扩散策略的虚假新闻检测方法
节点特征 邻居 BERT模型 策略 文本
3
敏感信息识别方法、装置、服务器和计算机可读存储介质
敏感信息识别方法 参数 图像特征提取模型 网络平台 文本
4
页面展示方法、装置、电子设备及存储介质
页面展示方法 对象 页面展示装置 标识 电子设备
5
证件制作方法、证件制作系统、计算机存储介质和电子设备
证件制作设备 设备管理服务器 证件制作系统 数据传输协议 模板
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号