摘要
本发明涉及人工智能技术领域,提供了一种针对医疗多模态大模型的视觉语言特征精细对齐方法,方法包括:用人工智能大模型对医疗专家知识文本特征进行深度学习和语义理解,生成问答对指令;提取医疗专家知识视觉特征,转化为问答对指令;用问答对指令对医疗多模态大模型进行训练;用人工智能大模型生成医疗图文问答对指令;为医疗多模态大模型引入强化学习,利用医疗图文问答对指令,实现视觉语言特征精细对齐。本发明提出了全自动地生成高质量医疗多模态指令数据的方法,使医疗多模态大模型在各种医学应用中提供准确可靠的输出内容。数据生成的全流程无需人工标注,节省了人力与时间成本。同时减少了模型推理幻觉,提升模型性能。
技术关键词
多模态
对齐方法
文本
图文
视觉特征
指令
影像
关键视觉信息
问答模板
术语
命名实体识别模型
样本
数据
概念
报告
语义
人工智能技术
医学
坐标
系统为您推荐了相关专利信息
小脑模型
注意力
关节力矩
模态传感器
机器人硬件平台
精准匹配方法
团队
关键词匹配方法
画像模型
深度匹配网络
智能审核方法
审核模型
审核规则
人机交互界面显示
内容显示