基于特征提取与伪标签对比聚类分析方法、设备及介质

AITNT
正文
推荐专利
基于特征提取与伪标签对比聚类分析方法、设备及介质
申请号:CN202411827683
申请日期:2024-12-12
公开号:CN119807779A
公开日期:2025-04-11
类型:发明专利
摘要
本发明公开了一种基于特征提取与伪标签对比聚类分析方法,其中方法包括:获取英文文本序列后根据BERT分词器和BERT嵌入模块,将文本序列转换为满足BERT编码器要求的输入句子字符嵌入E;将字符嵌入E输入到包含浅层字符表征融合机制的BERT编码器模块进行字符向量建模,获得初始隐含向量H;将字符嵌入E和初始隐含向量H输入到Electra以及BERT模块中进行局部语义抽取,对字符的局部语义向量建模,获得局部语义向量空间;将向量空间中的隐含向量引入到伪标签对比聚类分析中,使用伪标签先对整体模型进行评价打分,使用对比学习进行聚类。本发明在原本的意图识别任务中取得更好的效果。本发明可广泛应用于意图识别领域。
技术关键词
聚类分析方法 字符 注意力 意图类别 编码器模块 样本 语义向量空间 意图识别 文本 抽取关键词 矩阵 标签方法 序列 分类阈值 邻域 标签类别
系统为您推荐了相关专利信息
1
一种基于可解释深度学习的医院终端威胁行为识别方法
长短期记忆网络 生成全局热力图 时间序列图像 解释技术 注意力机制
2
一种多模态大模型推理方法及设备
令牌 注意力 跨模态 掩膜矩阵 视觉
3
一种基于CNN-LSTM混合神经网络的农作物暴雨灾害定量风险评估方法
定量风险评估方法 土壤相对湿度 混合神经网络模型 注意力机制 数据
4
文本处理方法、装置、电子设备、存储介质及程序产品
摘要 文本处理方法 字符 非临时性计算机可读存储介质 语句
5
一种基于大模型的工作报告生成方法及系统
工作报告生成方法 深度学习模型 报告生成系统 RNN模型 数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号