基于特征提取与伪标签对比聚类分析方法、设备及介质

正文

推荐专利

申请号：CN202411827683

申请日期：2024-12-12

公开号：CN119807779A

公开日期：2025-04-11

类型：发明专利

摘要

本发明公开了一种基于特征提取与伪标签对比聚类分析方法，其中方法包括：获取英文文本序列后根据BERT分词器和BERT嵌入模块，将文本序列转换为满足BERT编码器要求的输入句子字符嵌入E；将字符嵌入E输入到包含浅层字符表征融合机制的BERT编码器模块进行字符向量建模，获得初始隐含向量H；将字符嵌入E和初始隐含向量H输入到Electra以及BERT模块中进行局部语义抽取，对字符的局部语义向量建模，获得局部语义向量空间；将向量空间中的隐含向量引入到伪标签对比聚类分析中，使用伪标签先对整体模型进行评价打分，使用对比学习进行聚类。本发明在原本的意图识别任务中取得更好的效果。本发明可广泛应用于意图识别领域。

技术关键词

聚类分析方法字符注意力意图类别编码器模块样本语义向量空间意图识别文本抽取关键词矩阵标签方法序列分类阈值邻域标签类别

系统为您推荐了相关专利信息

一种基于可解释深度学习的医院终端威胁行为识别方法

长短期记忆网络生成全局热力图时间序列图像解释技术注意力机制

一种多模态大模型推理方法及设备

令牌注意力跨模态掩膜矩阵视觉

一种基于CNN-LSTM混合神经网络的农作物暴雨灾害定量风险评估方法

定量风险评估方法土壤相对湿度混合神经网络模型注意力机制数据

文本处理方法、装置、电子设备、存储介质及程序产品

摘要文本处理方法字符非临时性计算机可读存储介质语句

一种基于大模型的工作报告生成方法及系统

工作报告生成方法深度学习模型报告生成系统 RNN模型数据

基于特征提取与伪标签对比聚类分析方法、设备及介质

站点导航

APP 下载