一种基于跨语言集成的零样本文本分类方法

正文

推荐专利

一种基于跨语言集成的零样本文本分类方法

申请号：CN202410765291

申请日期：2024-06-14

公开号：CN118332127B

公开日期：2024-08-06

类型：发明专利

摘要

本发明适用于自然语言处理技术领域，具体是一种基于跨语言集成的零样本文本分类方法，该方法包括构建多语言数据集、获取多语言分类文本、文本标签集映射成图像标签集、特征提取、相似度计算和集成预测的步骤，其中，在集成预测的步骤中，本发明运用集成学习的投票策略，选择最终文本分类预测结果并输出。本发明采用了跨语言集成方法，并增加了中文和意大利语的多语言数据集，具备广泛的语言支持和适应能力；本发明采用Multilingual‑CLIP模型，显著提高了零样本文本分类的性能；本发明还采用了投票机制进行预测结果的集成，通过多个模型的预测结果进行投票选择，进一步提高了预测准确性。

技术关键词

文本分类方法多语言标签预测类别文本编码器图像编码器数据样本翻译工具图片索引中文文本变量集成方法策略注意力英语图像分割

系统为您推荐了相关专利信息

一种船舶多模态数据标签受限下的自适应主动学习方法

主动学习方法多模态数据标签标记决策

一种基于多任务的机电复合传动系统数据训练与预测方法

机电复合传动系统多任务损失函数故障检测时间序列数据分析数据格式转换方法

一种元宇宙虚拟空间构建方法及系统

虚拟空间构建方法判定特征参数三维建模工具序列

基于量子神经网络的手写数字识别方法、产品、介质及设备

量子神经网络手写数字识别方法量子优化算法图像训练集

一种基于深度神经网络的人像美化实时处理方法

深度神经网络皮肤表面粗糙度检测面部区域扩展特征向量定位关键点

一种基于跨语言集成的零样本文本分类方法

站点导航

APP 下载