中文医学大语言模型训练方法及装置

正文

推荐专利

中文医学大语言模型训练方法及装置

申请号：CN202410949277

申请日期：2024-07-16

公开号：CN118485141B

公开日期：2024-10-29

类型：发明专利

摘要

本申请公开了一种中文医学大语言模型训练方法及装置，涉及自然语言处理技术领域，所述的方法包括：通过医学文本对预设大语言模型进行预学习训练，使得大语言模型在语义层面上理解专业医学知识。根据开源中文医学考试数据集对预训练后的模型进行监督微调训练，从而降低计算复杂度和内存需求，这使得在保持模型性能的同时，能够在有限的计算资源下进行高效的微调。最后根据构建的知识图谱和强化学习数据集进行知识反馈的强化学习，有助于解决监督微调后由于模型过度拟合而出现的“幻觉”现象，从而将大语言模型的输出与相关的专业医学知识进行充分对齐，提高大语言模型在医学领域回答的准确度。

技术关键词

大语言模型医学三元组构建知识图谱文本数据计算机程序产品训练装置命名实体识别信号生成知识语义层面矩阵专业训练设备处理器自然语言模块

系统为您推荐了相关专利信息

脑部疾病评估方法、装置、电子设备及存储介质

模态特征疾病多模态融合方法特征提取模型对象

一种空调变频器的性能优化方法及设备

空调变频器性能优化方法文本识别模型接收变频器编辑界面

一种基于大模型的初中英语阅读理解试题智能解析方法

答案文本智能解析方法学生试题解析

一种快速报税方法、系统、设备及存储介质

自动化机器人电子税局报税方法服务端资源

一种多模态数据融合与动态建模的旅游偏好推荐方法

偏好推荐方法多模态数据融合图像特征向量日志记录系统语义分析算法

中文医学大语言模型训练方法及装置

站点导航

APP 下载