一种基于DPO的医疗大模型及其应用

正文

推荐专利

一种基于DPO的医疗大模型及其应用

申请号：CN202411541152

申请日期：2024-10-31

公开号：CN119650033A

公开日期：2025-03-18

类型：发明专利

摘要

本发明涉及一种基于DPO的医疗大模型及其应用，医疗大模型以数据前处理模块收集并处理数据、基于数据获取医疗大模型的输入和输出间的映射关系，偏好校准模块则基于DPO优化数据前处理模块、调节医疗大模型的模型参数，以反馈优化模块建立医疗偏好对齐质量评估策略和偏好对齐优化策略；医疗大模型可应用于医疗诊断问答系统。本发明解决现有医疗大模型的偏好对齐问题，提升医疗大模型的精准度和效率，通过直接优化语言模型，避免传统RLHF中的奖励模型构建和强化学习步骤，以更好地满足人类偏好。

技术关键词

梯度下降算法数据问答系统模块模糊神经网络序列策略校准人类答案参数指标定义决策校正编码关系文本格式数值

系统为您推荐了相关专利信息

一种基于多模态深度融合的DOA估计方法及装置

多模态深度估计方法 MIMO接收机 DOA估计辐射源

基于人工智能的双渠道供应链的集中式动态决策系统

动态决策系统销售方渠道深度强化学习算法深度强化学习技术

一种基于动态响应图注意力网络和大语言模型的零样本推荐方法

样本推荐方法动态物品流行度网络大语言模型

一种管道检测用自适应管网机器人

机器人轮胎切换组件叶轮车轮总成

一种基于多目标H∞/广义H₂附加阻尼控制器的风电机组共振抑制系统及方法

附加阻尼控制器风电机组输出功率引力搜索算法广义建立风电机组

一种基于DPO的医疗大模型及其应用

站点导航

APP 下载