摘要
本发明属于表征学习领域,具体涉及一种基于多模态大模型提示学习机制的前列腺癌诊断方法。包括以下步骤:步骤1数据预处理;步骤2计算关键帧和相似度,压缩无关剪辑;步骤3文本和图像对齐训练;步骤4测试阶段;本发明提出了一个基于相似度的筛选机制,在大模型的分割下,初步筛选粗粒度标签下的超声视频,在时序上重点关注病灶区域;同时提出了一个基于大模型的前处理机制,在数据端压缩了前列腺超声影像扫描中存在大量无关信息对模型的影响,从而提高模型诊断效果。
技术关键词
前列腺癌诊断方法
文本编码器
视频
关键帧
多模态
滑动窗口采样
标签文本
机制
代表
图像视觉特征
高密度
令牌
前馈神经网络
列表
系统为您推荐了相关专利信息
数据传输延迟
多层感知器网络
动态反馈机制
融合策略
多模态感知系统
全景视频数据
标志检测模型
预处理图像数据
Attention机制
模型训练模块
卸载方法
感兴趣区域提取
分片
视觉
视频图像分块
图像编辑方法
反演算法
关键词
文本编码器
交叉注意力机制