语料信息处理方法、装置、电子设备和可读存储介质

正文

推荐专利

申请号：CN202510399846

申请日期：2025-04-01

公开号：CN120412596A

公开日期：2025-08-01

类型：发明专利

摘要

本发明实施例公开了一种语料信息处理方法、装置、电子设备和可读存储介质，所述方法包括：通过大语言模型对多条语料信息进行信息提取，确定各语料信息的标签信息，基于部分语料信息的标签信息及聚类后的聚类结果训练特征模型；再基于特征模型对各语料信息的标签信息进行聚类，确定聚类树；最后根据聚类树对输入到大语言模型中的待分析语料进行归类，确定对应的类别标签。由此，本实施例能够使用大语言模型中搭建自动化的语料分析链路，并利用大语言模型中的丰富知识对语料信息进行处理，从而提高语料分析的效率和准确率。

技术关键词

大语言模型标签聚类信息处理方法计算机程序指令计算机程序产品 BERT模型电子设备信息处理装置可读存储介质训练特征处理器报告模块存储器数据终端平台

系统为您推荐了相关专利信息

一种农业面源污染高风险区域识别方法及系统

地理环境特征矩阵像素点注意力农业面源污染

糖尿病相关慢性肾脏病的肾功能进展预测模型的构建方法

XGBoost算法重要性排序方法 Logistic回归模型变量功能磁共振成像

一种基于全局几何先验的半监督医学图像分割方法及装置

医学图像分割方法交互特征图像分割模型编码特征分割医学图像

用于安全问答的方法、系统和计算机可读存储介质

生成提示信息大语言模型指令可读存储介质生成对用户

图文阅读器的处理方法、模型训练方法、装置及系统

文本深度学习模型阅读器格式图文

语料信息处理方法、装置、电子设备和可读存储介质

站点导航

APP 下载