摘要
本说明书实施例公开了一种针对用于健康告知的大语言模型进行训练的方法。该方案可以包括:获取初始训练数据;初始训练数据包括样本数据和针对样本数据的标签数据;样本数据包括用户输入样本和第一健康告知文本;根据关联关系数据,生成针对用户输入样本的知识扩展信息;关联关系数据为用于反映从预设文本以及预设文本所属领域的基础知识中提取的多条数据之间的关联关系;预设文本至少包括第一健康告知文本;基于初始训练数据和知识扩展信息,生成训练样本数据;利用训练样本数据对预训练的大模型进行监督微调训练,得到用于健康告知的大语言模型。
技术关键词
文本
训练样本数据
生成训练样本
标签
分析方法
切片
关系
数据获取模块
因子
实体
分析装置
处理器通信
指令
计算机设备
分析模块
语义
系统为您推荐了相关专利信息
融合语义
多模态数据融合
音频编码器
文本编码器
图像编码器
结构化日志数据
网络日志数据
网络安全控制
入侵检测模型
格式化
需求预测方法
复杂度
语义向量
量化评估技术
实体提取方法
自然语言文本
指令控制方法
关键词
机器学习技术
训练智能
逻辑回归模型
术后恶心呕吐
影像
筛选方法
混合核函数