医学语言模型构建方法、设备、存储介质及产品

AITNT
正文
推荐专利
医学语言模型构建方法、设备、存储介质及产品
申请号:CN202510002140
申请日期:2025-01-02
公开号:CN119397283A
公开日期:2025-02-07
类型:发明专利
摘要
本申请公开了医学语言模型构建方法、设备、存储介质及产品,涉及计算机语言模型领域。所述方法包括获取对通用预训练数据集中的数据进行领域分类和质量过滤,得到高质量医疗数据集;根据高质量医疗数据集和通用预训练数据集构建得到第一样本数据集,并利用第一样本数据集对第一语言模型进行训练,得到第一训练模型;根据高质量医疗数据集和开源医学SFT数据集构建第二样本数据集,并利用第二样本数据集对第一训练模型进行训练,得到第二训练模型;利用第三样本数据集对第二训练模型进行训练,得到第三训练模型;利用偏好样本数据集对第三训练模型进行训练,得到医学语言模型。本申请解决了传统方法忽略在CPT阶段数据构建的重要性问题。
技术关键词
语言模型构建方法 医学 数据 样本 标签 分类器 指令 计算机程序产品 因子 处理器 过滤方法 答案 可读存储介质 存储器 电子设备 阶段 参数
系统为您推荐了相关专利信息
1
基于频谱包络提取的色噪声环境信号频域检测方法及系统
频域检测方法 信号频谱包络 频域检测系统 极值 信号转换单元
2
一种端口标记方法、一种组播端口查找方法及其电路
端口 查找方法 标记方法 数据转发方法 输入端
3
一种岩溶区地表水与地下水交换量反演方法
地表水 反演方法 热传输 粒子群优化算法 数学模型
4
一种高斯束走时表优化存储方法、系统、设备及介质
优化存储方法 射线 优化存储系统 数据获取模块 处理器
5
一种基于国产化AI大模型的输配电线路智能分析与报告生成方法、系统、设备及介质
报告生成方法 故障特征模型 输配电 生成图文 模型训练模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号