摘要
本发明提供一种基于代表性样本选择与上下文增强的大模型命名实体识别方法,包括代表性样本选择模块、实体知识构建模块、动态上下文选择模块、大模型调用模块和迭代反馈优化模块,本发明代表性样本选择通过基于聚类的样本筛选策略,自动从未标注数据中挑选具有代表性和信息多样性的样本用于标注,实体描述集成针对每种实体类型,从已标注样本中抽取若干高质量实例,构建标准化的实体定义或描述提示。动态上下文选择针对待识别文本内容,通过语义相似度检索机制,从历史标注样本或描述集中动态选取与目标文本最相关的上下文示例,作为辅助提示输入,提升LLM在复杂或变化场景中的适应性和泛化能力。
技术关键词
命名实体识别方法
样本
大语言模型
动态上下文
文本
语义向量
模块
命名实体识别系统
语义结构
向量检索技术
JSON结构
实体知识库
BERT模型
定义提取
模板
生成机制
系统为您推荐了相关专利信息
三系杂交水稻
细胞质雄性不育恢复基因
高通量筛选平台
试剂盒
抗除草剂基因
药物重定位方法
相互作用特征
非线性特征
邻域
重定位技术
深度神经网络
健康管理方法
神经模糊系统
锂离子电池
测试电池
辅助决策方法
事件特征
环境监测传感器
灰狼优化算法
图谱