基于伪标签的意图识别模型训练方法、意图识别方法和装置

正文

推荐专利

申请号：CN202510509485

申请日期：2025-04-22

公开号：CN120523955A

公开日期：2025-08-22

类型：发明专利

摘要

本发明提供一种基于伪标签的意图识别模型训练方法、意图识别方法和装置，方法包括：将样本文本输入到语言模型中提取特征向量；基于特征向量对样本文本聚类，将聚类结果作为伪标签，计算有标注样本文本的真实标签与伪标签的归一化互信息；确定每个样本对应的置信度分数；置信度分数用于量化伪标签中的噪声，筛选高置信度样本并将对应的伪标签作为自监督信号，迭代优化语言模型直到收敛；迭代后重新初始化聚类，更新聚类结果、归一化互信息和迭代次数；在迭代次数达到上限或归一化互信息增幅小于阈值时，终止训练并将语言模型确定为意图识别模型；能够解决噪声伪标签不断传播积累，导致模型识别新意图的能力下降的问题；提高模型识别新意图的能力。

技术关键词

意图识别模型样本置信度阈值文本标签意图识别方法意图类别优化器动态聚类语义向量预训练语言模型语义特征 K近邻算法参数指令非线性电子设备噪声

系统为您推荐了相关专利信息

一种基于多模态协同学习框架的重识别模型训练方法及系统

可见光图像红外光识别模型训练方法行人重识别模型语义

一种基于人工智能的多灾种分级预测方法

矿山灾害分级预测方法皮尔逊相关系数样本数据

一种基于强化学习的多模态诊断治疗方案推荐系统

医学影像特征推荐系统加权特征文本特征提取单元

一种基于ANN和LLM的广告语义检索模型的建立方法

语义检索模型样本数据 BERT模型广告

面部表情识别模型的训练方法及面部表情识别方法

面部表情识别模型面部表情识别方法噪声图像监督学习方法注意力

基于伪标签的意图识别模型训练方法、意图识别方法和装置

站点导航

APP 下载