基于大语言模型的数据知识提取方法、系统、设备及存储介质

正文

推荐专利

申请号：CN202411555650

申请日期：2024-11-04

公开号：CN119646134B

公开日期：2025-12-12

类型：发明专利

摘要

本发明公开了一种基于大语言模型的数据知识提取方法、系统、设备及存储介质，方法包括：对获取到的原始数据进行预处理；从原始数据中提取特征，选择对应任务特征，通过计算特征之间的相关系数矩阵，去除高相关性的特征；选择任务的大语言模型，捕捉通用语言和知识，在特定领域或任务的标注数据集上对大语言模型进行微调；基于大语言模型推理与提示词工程，采用二次分块迭代的方式提取知识源信息，利用微调训练后的大语言模型的上下文理解能力，将不同数据源提取的信息进行整合；定义评估标准，分析大语言模型的错误案例，识别改进方向，根据评估结果和错误分析，调整模型参数和训练数据。本发明具备提高知识提取方法的效率和准确率的优点。

技术关键词

大语言模型知识提取方法计算机程序指令分块特征提取模块数据获取模块文本词嵌入技术词嵌入模型更新模型参数展示实体变量处理器矩阵预训练模型生成向量序列冗余特征策略

系统为您推荐了相关专利信息

一种基于区块链的数据处理方法和装置

对象计算机可读形式数据验证标识智能合约代码

一种基于深度学习的电力设备跨模态数据融合方法及系统

跨模态数据电气特征声纹特征应力电力设备

一种数据分析系统、方法、装置、存储介质及电子设备

服务端客户端设备大语言模型数据平台标识

医学图像分割方法和装置、电子设备、存储介质

图像特征提取医学图像分割方法重建医学图像样本图像分割模型

基于多模态大模型的地理定位方法、装置、设备及介质

全景图文本地理定位方法多模态立方体

基于大语言模型的数据知识提取方法、系统、设备及存储介质

站点导航

APP 下载