摘要
本申请提供了一种医疗大语言模型的训练及推理方法、装置、设备、介质及产品,涉及自然语言处理技术领域,包括:构建医疗训练数据集;结合医疗训练数据集对医疗大语言模型进行训练,其中,根据高质量的医疗数据训练集构建目标训练数据;将目标训练数据代入医疗大语言模型进行动态拆分训练,用于对输入的原始问题进行拆分得到若干个子问题、处理每个子问题,得到与目标子问题对应的子回答、进而形成全面、准确的推理结果:针对不同场景类型,采用不同调用工具对医疗大语言模型进行工具调用训练,用于处理子问题;通过结合动态拆分训练和工具调用训练,显著提升医疗大语言模型的性能和实用性,提高模型处理医疗复杂问题的效率和深度。
技术关键词
大语言模型
推理方法
数据
医学
子模块
样本
关键词
场景
训练集
计算机设备
推理系统
可读存储介质
动态
计算机程序产品
训练系统
处理器
指令
自然语言