摘要
本发明涉及一种基于大语言模型的企业产业链识别方法及系统,该方法包括基于大数据分析技术,获取目标企业信息;针对待分析的产业,进行多个相对独立的产业链环节的划分;针对划分出的每个产业链环节,获取描述性文本;基于文本匹配,为目标企业信息标注所属的产业链环节标签,得到企业产业链环节归属标注信息;基于每个产业链环节的描述性文本、企业产业链环节归属标注信息、以及根据任务需求与模型优化策略所确定的任务提示词构建训练数据集、验证数据集;将训练数据集、以及验证数据集输入到生成式大语言模型中进行模型训练,得到对企业产业链识别的专属大语言模型。该方法的实施能够实现对企业产业链的精准识别。
技术关键词
大语言模型
大数据分析技术
文本
识别方法
模型训练模块
企业经营范围
噪声数据
标签
键值
全程自动化
行业特征
清洗规则
采样技术
识别系统
异常数据
策略
自然语言
系统为您推荐了相关专利信息
遗传算法
大语言模型
数据生成方法
计算机程序产品
数据生成装置
监测点
异常识别方法
皮尔逊相关系数
供水管
计算机可读指令
高分辨一维距离像
数据识别模型
雷达
识别方法
多模态特征