摘要
本发明实施例公开了一种语料信息处理方法、装置、电子设备和可读存储介质,所述方法包括:通过大语言模型对多条语料信息进行信息提取,确定各语料信息的标签信息,基于部分语料信息的标签信息及聚类后的聚类结果训练特征模型;再基于特征模型对各语料信息的标签信息进行聚类,确定聚类树;最后根据聚类树对输入到大语言模型中的待分析语料进行归类,确定对应的类别标签。由此,本实施例能够使用大语言模型中搭建自动化的语料分析链路,并利用大语言模型中的丰富知识对语料信息进行处理,从而提高语料分析的效率和准确率。
技术关键词
大语言模型
标签
聚类
信息处理方法
计算机程序指令
计算机程序产品
BERT模型
电子设备
信息处理装置
可读存储介质
训练特征
处理器
报告
模块
存储器
数据
终端
平台
系统为您推荐了相关专利信息
XGBoost算法
重要性排序方法
Logistic回归模型
变量
功能磁共振成像
医学图像分割方法
交互特征
图像分割模型
编码特征
分割医学图像
生成提示信息
大语言模型
指令
可读存储介质
生成对用户