一种基于大语言模型的文本结构化方法及系统

正文

推荐专利

申请号：CN202411740491

申请日期：2024-11-29

公开号：CN119670752A

公开日期：2025-03-21

类型：发明专利

摘要

本发明属于信息抽取技术领域，公开了一种基于大语言模型的文本结构化方法及系统。该方法通过对大语言模型的JSON格式分析，进行训练数据处理；对大语言模型进行训练、微调，用vLLM进行训练、微调后的大语言模型的部署；采取CoT提示的方式对部署后的大语言模型进行文本结构化，对出现错误的JSON格式数据，采用JSON解析结果的反思策略，进一步提升大语言模型的结构化输出能力。本发明通过微调与指令结合解决大模型在知识抽取任务中生成JSON字符串不符合要求的问题；大模型按照schema.org要求生成知识图谱规范的JSON，实现端到端的文本结构化，无须进一步的知识加工，节省后续知识加工的工作量。

技术关键词

文本结构化方法大语言模型结构化系统训练数据处理键值 JSON字符串信息抽取技术生成知识图谱格式化身份可读存储介质策略多任务分析模块指令

系统为您推荐了相关专利信息

一种基于知识图谱的大语言模型车辆故障原因分析方法及系统

故障实体故障原因分析方法模型车辆知识图谱数据文本

多目标协同灌溉施氮智能决策方法、设备和程序产品

智能决策方法生态系统服务情景策略变量

一种基于分布式文件系统实现千亿数据实时返回的方法

分布式文件系统关键字数据库主键数据处理方式离线

一种基于大语言模型的汽车产品匹配系统和方法

兴趣产品匹配方法大语言模型画像样本

信息显示方法、装置、电子设备及存储介质

信息显示方法答案大语言模型控件基础

一种基于大语言模型的文本结构化方法及系统

站点导航

APP 下载