摘要
本发明提供了一种基于多模态大模型细粒度知识生成的命名实体识别方法,属于自然语言处理中的信息抽取技术领域。本发明方法结合多模态大模型MLLM和大语言模型LLM共同生成细粒度辅助知识,LLM使用上下文学习的方式,引导其生成和样本相关的辅助知识,MLLM使用人工标注数据对其进行微调,使其根据输入的文本和图像信息,输出相关的辅助知识,将得到的辅助知识与原始文本结合,进入下游的序列标注模型进行训练和推理,完成命名实体识别。本发明兼顾了对信息抽取有利的世界知识和多模态信息,提升了下游序列标记模型进行命名实体识别的性能,能够更精准地识别出文本中的实体。
技术关键词
序列标注模型
命名实体识别方法
样本
多模态
文本
条件随机场
命名实体识别模型
图像视觉特征
信息抽取技术
大语言模型
编码特征
拼接方式
编码器
自然语言
数据
系统为您推荐了相关专利信息
轻量级神经网络
推理方法
检索策略
索引方式
多源异构数据
标志物
预后风险评估
质谱流式细胞技术
癌症预后评估
辣根过氧化酶
构建机器学习模型
岩性识别方法
初始聚类中心
标签
矩阵
问答模型
医学知识库
医疗问诊方法
训练样本集
计算机设备