一种针对医疗多模态大模型的视觉语言特征精细对齐方法

正文

推荐专利

申请号：CN202411381995

申请日期：2024-09-30

公开号：CN119357443B

公开日期：2025-09-02

类型：发明专利

摘要

本发明涉及人工智能技术领域，提供了一种针对医疗多模态大模型的视觉语言特征精细对齐方法，方法包括：用人工智能大模型对医疗专家知识文本特征进行深度学习和语义理解，生成问答对指令；提取医疗专家知识视觉特征，转化为问答对指令；用问答对指令对医疗多模态大模型进行训练；用人工智能大模型生成医疗图文问答对指令；为医疗多模态大模型引入强化学习，利用医疗图文问答对指令，实现视觉语言特征精细对齐。本发明提出了全自动地生成高质量医疗多模态指令数据的方法，使医疗多模态大模型在各种医学应用中提供准确可靠的输出内容。数据生成的全流程无需人工标注，节省了人力与时间成本。同时减少了模型推理幻觉，提升模型性能。

技术关键词

多模态对齐方法文本图文视觉特征指令影像关键视觉信息问答模板术语命名实体识别模型样本数据概念报告语义人工智能技术医学坐标

系统为您推荐了相关专利信息

业务邮件回复方法、装置、设备、存储介质及计算机程序产品

邮件回复方法计算机程序产品语义指令合规性

一种融合小脑模型与跨模态注意力的控制装置

小脑模型注意力关节力矩模态传感器机器人硬件平台

一种储气库膏盐盖层封闭性监测方法

井口监测方法压力岩石结构气体泄漏状况

一种基于大模型的团队精准匹配方法及系统

精准匹配方法团队关键词匹配方法画像模型深度匹配网络

一种用于环评文件审核的智能审核方法和系统

智能审核方法审核模型审核规则人机交互界面显示内容显示

一种针对医疗多模态大模型的视觉语言特征精细对齐方法

站点导航

APP 下载