摘要
本发明公开了一种基于多模态大模型的舌图像分类方法、系统及终端,所述方法包括:获取目标用户的基本文本数据,在标准化光源和色彩校准条件下获取所述目标用户的原始舌图像,对所述原始舌图像进行初步处理,得到合格舌图像;获取所述合格舌图像经过标记后的舌象文本数据;将所述合格舌图像、所述基本文本数据和所述舌象文本数据通过加密信道输入到预先训练好的舌象多模态大模型中进行特征提取、特征融合和特征分析,得到舌图像分类结果;根据所述舌图像分类结果生成所述目标用户的舌图像分析报告。本发明能够更深入地学习舌图像中的细微特征和复杂模式,提高了舌图像分类的准确性。
技术关键词
图像分类方法
多模态
文本特征向量
文本编码器
分类程序
数据
图像分类系统
交叉注意力机制
图像分析
视觉
高清摄像头
语法结构
图像格式转换
色彩
加密
信道
系统为您推荐了相关专利信息
图像异常检测方法
局部视觉特征
多尺度特征提取
样本
图像编码器
资源调度系统
服务终端
医疗场景
多模态传感器
医院
图像生成方法
图像生成模型
生成对抗网络
随机噪声
图像生成系统
故障诊断引擎
多模态数据采集
分布式学习
多模态深度学习
时间卷积网络