摘要
本发明涉及一种市场监管多领域数据标签生成方法及系统,该方法包括:获取市场监管多领域的历史文本数据并进行数据预处理,得到市场监管文本数据;采用监督微调的方式对大语言模型进行训练,通过训练好的大语言模型提取市场监管文本数据的关键词;通过自然语言处理技术,提取市场监管文本数据的关键词;将多种方式得到的关键词重新组合,进行自然语言处理和同义词推荐处理,整合成最终的标签文本集合。本发明采用了多种语言模型对数据进行处理,包括自然语言处理技术和基于大模型的文本处理技术。通过不同的模型对同一份数据进行处理,可以提取出更多样化、更全面的关键词和摘要,从而提高标签生成的准确性和覆盖率。
技术关键词
数据标签生成方法
关键词
自然语言
标签文本
同义词
文本处理技术
标签监控
模型训练模块
标签管理
大语言模型
存储器
特种设备
生成系统
身份验证
程序
数据格式
系统为您推荐了相关专利信息
生成方法
规划
建立关键词索引
计算机程序产品
信息检索
文本特征提取方法
关键词
频率
判定特征
特征关联分析