摘要
本发明涉及一种基于LLM模型的企业信息提取方法,获取企业信息的样本数据,进行预处理,对预处理后的样本数据进行转换及编码;利用得到的数据信息进行LoRA微调训练;以训练得到的新参数集替换LLM模型的原始参数集,对测试数据进行计算,获得计算结果;若更新参数及后的LLM模型的准确率达到预设标准,则结束,否则将测试数据作为新增样本数据,与初始样本数据一并重复训练。本发明借助LLM模型在自然语言理解能力的提升,利用本行业内的小样本行业业务数据,对开源LLM模型进行LoRA微调训练,再利用训练后的模型计算处理业务数据,包括分类、打标、命名实体提取等,特别是对企业信息进行准确信息提取。
技术关键词
信息提取方法
样本
生成对抗网络模型
企业
数据
参数
偏差
节点
门牌号
街道
自然语言
编码
纠错
网格
实体
标签
元素
系统为您推荐了相关专利信息
回归预测模型
率预测方法
因子
计算机可执行指令
时序特征
数据驱动预测控制
非线性系统
抗干扰控制
滚动时域优化
干扰观测器
数值分析方法
数值分析模型
电压
测量误差
非线性误差