摘要
本申请公开了一种医疗科普问答模型微调方法、装置、设备、介质及产品,涉及大语言模型微调领域,该方法包括对医疗文本问答数据集中的数据进行清洗,确定清洗后的指令‑输入‑输出范式的数据集,并作为微调训练数据集;在预训练的大语言模型中,定位至多头自注意力机制中的QKV投影矩阵与前馈神经网络中的权重矩阵;分别在各个矩阵中,引入两个低秩矩阵,微调预训练的大语言模型,确定微调后的大语言模型;微调后的大语言模型用于根据用户与微调后的大语言模型使用交互的过程中的问题数据,生成回答,本申请微调大语言模型,提高了处理特定任务的性能,降低了计算成本,且增强了模型对特定细节的掌握能力,满足特定用户群体或应用场景的需求。
技术关键词
问答模型
微调方法
矩阵
前馈神经网络
注意力机制
大语言模型
数据
文本
微调装置
云服务器
超参数
处理器
生成答案
序列
计算机程序产品
指令
计算机设备
元素
优化器
系统为您推荐了相关专利信息
自动化控制方法
自动化控制软件
坐标系
直线导轨系统
状态识别算法
压力传感器误差
误差标定
高低温试验箱
信号采集设备
标定方法
图像识别算法
垃圾袋
识别方法
卡尔曼滤波
匈牙利算法
高斯混合隐马尔可夫模型
故障检测方法
样本
小波核函数
重构误差