一种基于跨语言集成的零样本文本分类方法

AITNT
正文
推荐专利
一种基于跨语言集成的零样本文本分类方法
申请号:CN202410765291
申请日期:2024-06-14
公开号:CN118332127B
公开日期:2024-08-06
类型:发明专利
摘要
本发明适用于自然语言处理技术领域,具体是一种基于跨语言集成的零样本文本分类方法,该方法包括构建多语言数据集、获取多语言分类文本、文本标签集映射成图像标签集、特征提取、相似度计算和集成预测的步骤,其中,在集成预测的步骤中,本发明运用集成学习的投票策略,选择最终文本分类预测结果并输出。本发明采用了跨语言集成方法,并增加了中文和意大利语的多语言数据集,具备广泛的语言支持和适应能力;本发明采用Multilingual‑CLIP模型,显著提高了零样本文本分类的性能;本发明还采用了投票机制进行预测结果的集成,通过多个模型的预测结果进行投票选择,进一步提高了预测准确性。
技术关键词
文本分类方法 多语言 标签 预测类别 文本编码器 图像编码器 数据 样本 翻译工具 图片 索引 中文文本 变量 集成方法 策略 注意力 英语 图像分割
系统为您推荐了相关专利信息
1
一种船舶多模态数据标签受限下的自适应主动学习方法
主动学习方法 多模态 数据标签 标记 决策
2
一种基于多任务的机电复合传动系统数据训练与预测方法
机电复合传动系统 多任务损失函数 故障检测 时间序列数据分析 数据格式转换方法
3
一种元宇宙虚拟空间构建方法及系统
虚拟空间构建方法 判定特征 参数 三维建模工具 序列
4
基于量子神经网络的手写数字识别方法、产品、介质及设备
量子神经网络 手写数字识别方法 量子优化算法 图像 训练集
5
一种基于深度神经网络的人像美化实时处理方法
深度神经网络 皮肤表面粗糙度 检测面部区域 扩展特征向量 定位关键点
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号