一种基于细粒度视觉提示的医学视觉问答推理方法

AITNT
正文
推荐专利
一种基于细粒度视觉提示的医学视觉问答推理方法
申请号:CN202411384380
申请日期:2024-09-30
公开号:CN119358672A
公开日期:2025-01-24
类型:发明专利
摘要
本发明公开了一种基于细粒度视觉提示医学视觉问答的推理方法。本发明步骤:1、首先根据预定义的关键点数量,生成统一的网格点并叠加到原始图像上得到增广图像;利用图像编码器和提示编码器分别处理原始图像和增广图像,从而得到图像嵌入和提示嵌入,进而获取包含相关器官的全局掩码,将全局掩码分割为细粒度的实例级局部掩码;2、利用分层提取器将实例级局部掩码和原始图像转化为多模态高级语义表示;3、利用答案生成模块生成最终答案,答案生成模块整合图像特征和文本特征,通过这种多模态融合,生成的综合特征随后被用作答案生成模块的输入,从而实现对最佳医学答案的生成。本发明显著提升了答案生成的准确性和相关性。
技术关键词
图像嵌入 推理方法 图像编码器 视觉特征 分层提取器 医学图像空间 关键点 多层次 深度特征提取 深度学习算法 文本编码器 生成答案 网格 模块
系统为您推荐了相关专利信息
1
结果推理方法及装置、电子设备和存储介质
网络结构 分支 数据 推理方法 电子设备
2
一种基于多模态深度学习框架的冷冻电镜密度图重建方法
多模态深度学习 冷冻电镜 密度 傅立叶 框架
3
多模态知识图谱多跳推理方法、系统、终端及存储介质
推理方法 图谱 多模态 实体 强化学习框架
4
一种外包计算下二值神经网络模型的隐私保护推理方法
推理方法 服务器 外包 推理系统 协议
5
基于人工智能识别影像的测试方法、装置、设备及介质
生成对抗网络模型 人工智能识别 对抗性 光学字符识别 测试方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号