一种基于大语言模型的文本结构化方法及系统

AITNT
正文
推荐专利
一种基于大语言模型的文本结构化方法及系统
申请号:CN202411740491
申请日期:2024-11-29
公开号:CN119670752A
公开日期:2025-03-21
类型:发明专利
摘要
本发明属于信息抽取技术领域,公开了一种基于大语言模型的文本结构化方法及系统。该方法通过对大语言模型的JSON格式分析,进行训练数据处理;对大语言模型进行训练、微调,用vLLM进行训练、微调后的大语言模型的部署;采取CoT提示的方式对部署后的大语言模型进行文本结构化,对出现错误的JSON格式数据,采用JSON解析结果的反思策略,进一步提升大语言模型的结构化输出能力。本发明通过微调与指令结合解决大模型在知识抽取任务中生成JSON字符串不符合要求的问题;大模型按照schema.org要求生成知识图谱规范的JSON,实现端到端的文本结构化,无须进一步的知识加工,节省后续知识加工的工作量。
技术关键词
文本结构化方法 大语言模型 结构化系统 训练数据处理 键值 JSON字符串 信息抽取技术 生成知识图谱 格式化 身份 可读存储介质 策略 多任务 分析模块 指令
系统为您推荐了相关专利信息
1
一种基于知识图谱的大语言模型车辆故障原因分析方法及系统
故障实体 故障原因分析方法 模型车辆 知识图谱数据 文本
2
多目标协同灌溉施氮智能决策方法、设备和程序产品
智能决策方法 生态系统服务 情景 策略 变量
3
一种基于分布式文件系统实现千亿数据实时返回的方法
分布式文件系统 关键字 数据库主键 数据处理方式 离线
4
一种基于大语言模型的汽车产品匹配系统和方法
兴趣 产品匹配方法 大语言模型 画像 样本
5
信息显示方法、装置、电子设备及存储介质
信息显示方法 答案 大语言模型 控件 基础
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号