一种基于大语言模型的文档关键信息抽取方法

AITNT
正文
推荐专利
一种基于大语言模型的文档关键信息抽取方法
申请号:CN202411483004
申请日期:2024-10-23
公开号:CN119599107A
公开日期:2025-03-11
类型:发明专利
摘要
本发明公开了一种基于大语言模型的文档关键信息检索方法,根据多级输入的文档和用户输入的问题输出检索结果,该方法包括:构建领域知识图谱;构建并训练问题提取模型,通过问题提取模型得到用户输入的问题的关键信息和意图;根据关键信息和意图在知识图谱中检索,形成对关键信息的段落描述;对所述文档进行筛选并拆分成多个文本块,得到与用户输入的内容最相关的若干个文本块;使用大语言模型得出最高嵌入相似性的对应文本块;采用大语言模型整合推理对应文本块和段落描述,得到文档中的关于用户输入问题的信息。有益效果:不仅能够提高信息抽取的准确性和效率,还能够适应不同领域的特定需求,为文档自动化处理和知识管理提供强有力的技术支持。
技术关键词
大语言模型 信息检索方法 文本 三元组 图谱 标签标注方法 构建查询语句 信息抽取方法 文档自动化 条件随机场 意图类别 语义 实体 多标签 处理器 可读存储介质 关系 存储器
系统为您推荐了相关专利信息
1
基于用户行为信息的广告媒体智能推送系统及方法
智能推送系统 浏览网页信息 图像内容特征 广告媒体 数据特征提取
2
一种大模型智能管理平台
智能管理平台 动态知识图谱 多智能体深度强化学习 更新知识图谱 强化学习策略
3
一种大模型辅助的桥梁知识图谱生成式构建方法
大语言模型 知识图谱推理方法 桥梁 节点 知识图谱构建
4
基于传感器网络的水电站安全管理方法及装置
有向传感器节点 水电站设备 数字孪生模型 故障特征 剩余使用寿命
5
一种基于人工智能技术的客服信息确定方法及装置
人工智能技术 语义 上下文特征 事件驱动策略 预训练语言模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号