摘要
本发明公开了一种基于大模型的潜在绿色企业挖掘方法和装置,包括:对大语言模型基座进行领域预训练以及进行绿色企业与绿色产业识别任务的微调;获取每个企业的经营范围、业务范围以及生态环境行政处罚相关文本信息,并与企业申请绿色信贷时填写的信贷业务相关文本信息进行文本处理;将经过处理的文本数据和问题输入微调后的大语言模型,输出是否为绿色企业以及绿色企业所属的绿色产业类别,同时由人工对输出结果进行二次确认得到确认结果,将确认结果作为标签对大语言模型进行训练;利用训练好的大语言模型进行绿色企业挖掘。本发明通过一整套智能的流程设计,极大削减了人力成本,简化了潜在绿色企业的挖掘流程,缩短潜在绿色企业的挖掘周期。
技术关键词
企业
挖掘方法
样本
大语言模型
数据
模型训练模块
关键词
基座
识别模块
标签文本
存储计算机程序
网页页面
挖掘设备
爬虫技术
挖掘装置
分词
目录