一种基于大语言模型的文本数据自动提取方法和设备

AITNT
正文
推荐专利
一种基于大语言模型的文本数据自动提取方法和设备
申请号:CN202511096892
申请日期:2025-08-06
公开号:CN120911446A
公开日期:2025-11-07
类型:发明专利
摘要
本发明涉及数据信息处理技术领域,具体为一种基于大语言模型的文本数据自动提取方法和设备。所述方法包括获取目标文本,并将其转化为Markdown格式的文本数据集,文本数据集包括文本数据和表格数据;根据大语言模型构建实体提取提示词,利用大语言模型和实体提取提示词从文本数据集中提取包含目标数据的目标实体,并记录目标实体数量;根据大语言模型构建关系抽取提示词,基于目标实体和目标实体数量,利用大语言模型和关系抽取提示词对文本数据集进行关系抽取,得到目标文本数据集;采用最短路径匹配算法对目标文本数据集进行匹配,得到结构化的目标文本数据。以此方式,可以发挥大语言模型成本低、能力强、速度快和泛化性好的优势,提高文本数据的利用效率。
技术关键词
大语言模型 文本 实体 词典 数据自动提取方法 BERT模型 关系 数据信息处理技术 样本 路径匹配 字符 索引 注意力 编码器 处理器通信 格式 表格 矩阵
系统为您推荐了相关专利信息
1
一种咨询服务语料数据资产化方法
数据资产化方法 构建知识图谱 机器学习算法 实体 企业
2
一种基于YOLO与VLM融合的水库安全智能巡检方法及其系统
智能巡检方法 水库 文本 报告 坝体
3
一种空调系统及其控制方法
大语言模型 文本 意图 控制空调设备 模板
4
一种运维试题的自动生成方法、装置、介质及设备
文本 实体 生成知识 自动生成方法 运维
5
一种以症状清晰化为目的的智能问诊对话方法和系统
大语言模型 医疗知识图谱 计算机可读取存储介质 对话方法 策略
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号