摘要
本申请涉及一种基于跨模态信息补全的零样本文本分类方法和装置。该方法通过设计新的图像标签映射机制并基于上下文文本生成实现跨模态信息补全的图像构建,最后在推理阶段设计多模态协同推理框架,通过提示工程优化文本输入增强文本语义感知能力,有效提升了CLIP模型的零样本推理能力。针对自动化标签生成的语义偏差问题,基于上下文文本生成,构建跨模态信息补全的图像,以优化文本语义表征完整性,同时在推理阶段引入提示设计增强文本语义感知能力;两阶段关键词自动选择机制,首先利用大模型生成关键词候选集合,其次通过多模态匹配与选择,选择最佳关键词短语作为跨模态信息补全的文本信息,有效提高了语义准确性和领域适配性。
技术关键词
文本分类方法
跨模态
标签
样本
预训练语言模型
位置映射
语义
图像特征编码
图像特征向量
图像编码
字体
训练集
文本分类装置
多模态协同
关键词特征
生成关键词
系统为您推荐了相关专利信息
射频干扰检测方法
解码器结构
数据
制作标签
模块
模型训练方法
序列推荐方法
节点
异构
训练样本集
大语言模型
电子元件
多模态
电子设计自动化
引脚功能