基于大模型生成实体识别数据集的方法及系统

AITNT
正文
推荐专利
基于大模型生成实体识别数据集的方法及系统
申请号:CN202510365902
申请日期:2025-03-26
公开号:CN120218213A
公开日期:2025-06-27
类型:发明专利
摘要
本发明公开了基于大模型生成实体识别数据集的方法及系统,方法包括:从垂直领域的知识图谱数据库导出所有的实体,生成实体列表;在实体列表中采样若干个实体;利用大模型生成包含所采样的实体的文本;匹配标注文本中的实体得到标签,利用文本和标签生成数据集;利用大模型验证数据集,过滤掉数据集中不规范的数据;本发明的优点在于:保证文本中标注的实体词真实可靠,构建的数据集中不存在噪声。
技术关键词
实体 知识图谱数据库 文本 生成数据集 标签 列表 采样模块 大语言模型 定义 指令 关系 噪声
系统为您推荐了相关专利信息
1
基于AI大模型的营销数据分析方法及系统
数据分析方法 编码 策略 计算中心 因子
2
基于复杂网络标签传播的图像分割方法及系统
图像分割方法 节点分配标签 邻居 核心 纹理特征
3
一种基于LLaVA模型的高效学生中国画鉴赏系统和鉴赏方法
前馈神经网络 交叉注意力机制 客户端 学生 文字特征
4
一种基于大语言模型协同的越南语依存句法数据增强方法
依存句法树 大语言模型 数据 依存句法分析 解析句子
5
对象匹配方法、装置、可读介质、电子设备及程序产品
对象匹配方法 深度学习模型 标签 对象匹配装置 大语言模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号