摘要
本发明提供了一种基于大语言模型的标签体系建设方法,包括如下步骤:第一步:待处理文本整理和入库,第二步:调用预训练大模型使用其生成能力打出标签;第三步:对经过第二步得到的所有标签进行标签后处理;第四步:对经过第三步中标签后处理得到的标签进行聚类;第五步:对经过第四步得到的聚类结果利用预训练大模型得到标签体系;第六步:标签体系入库;第七步:使用构建的标签体系对第一步中得到的文本库打标签;该方法结合了深度学习、自然语言处理和大规模预训练模型的最新进展,解决当前文本分类需要预先建立标签体系以及标签体系不能完全反映文本内容分类问题,适用于多种文本类型,解决了现有技术中的弊端。
技术关键词
标签体系
文本
大语言模型
数据库表结构
关系型数据库
NoSQL数据库
执行聚类算法
数据库系统
可视化界面
轮廓系数
格式
信息获取效率
打标签
分词
命令行工具
系统为您推荐了相关专利信息
多媒体
深度学习模型
识别模块
输入输出模块
跨模态
自动代码生成方法
大语言模型
基础
非暂态计算机可读存储介质
软件开发环境
自助服务方法
智能印章
面部特征图像
自助服务系统
账户
价格趋势预测
交易策略生成方法
蒙特卡洛
粒子群优化算法
多维特征数据