摘要
本发明提供一种眼科语言大模型的构建方法,包括:S1、获取多个眼科领域原始数据集;S2、采用预先配置的第一语言大模型筛选出与眼科相关的数据;S3、采用第一语言大模型对筛选出的的数据进行清洗以及标准化处理,以标准化为{提示词、用户问题、问题回答}结构的数据样本;S4、收集眼科专业知识并基于此构建眼科专业医学教材片段,采用第一大语言模型根据眼科专业医学教材片段生成与片段内容相关的眼科问答数据;S5、采用第一大语言模型根据步骤S4中的数据生产多组语义等价但表达方式不同的新数据,并将新数据统一标准化;S6、获取的数据样本组成训练集,以提示词和用户问题为输入,问题回答为标签,对基座大语言模型进行有监督训练。
技术关键词
大语言模型
眼科专业
智能问诊方法
数据
多轮对话
样本
医学
分布式方式
基座
训练集
处理器
指令
语义
可读存储介质
存储器
策略
标签
疾病
电子设备
系统为您推荐了相关专利信息
网络通信数据
设备运行状态数据
可用性评估
风险预警方法
动态权重分配
风险评估模型
堆放方法
图像处理技术识别
计算机存储介质
材料特征
试车平台
随机森林模型
航空发动机传感器
试车方法
训练深度学习模型
矩阵控制方法
中央控制平台
智能控制算法
路面
中央控制单元