一种基于大语言模型的老年健康管理指令数据集构建方法

正文

推荐专利

申请号：CN202510067758

申请日期：2025-01-16

公开号：CN120067420A

公开日期：2025-05-30

类型：发明专利

摘要

本发明公开了一种基于大语言模型的老年健康管理指令数据集构建方法，基于网络爬虫等多元获取数据方法，通过数据清洗与过滤获得高质量、专注于老年健康管理问答数据和无监督数据；大语言模型信息抽取阶段，根据无监督文本数据，设计提示词来知识引导与背景知识相关的指令数据；提示大语言模型，对信息抽取形成的问答数据与不同基座模型生成的答案进行语义相似性判断，删除语义差异大、准确性欠佳、领域关联程度低内容；人工评测数据后，基于评测数据与先验知识支持下的投票法训练分类模型，对剩余指令数据进行多重指标的投票，筛选出符合高质量标准数据，构建具备高准确性和领域相关性的指令数据集，为优化老年健康管理智能问答提供精准数据支持。

技术关键词

老年健康管理数据集构建方法大语言模型指令训练分类模型答案语义无监督生成提示词格式保健养生爬虫数据分类随机森林样本基座分类器参数代表

系统为您推荐了相关专利信息

一种用于重症监护室的智能AI用电监管系统

重症监护室监管系统时序特征故障预测模型参数

一种汽车内饰件缺陷检测方法及系统

像素点缺陷检测方法检测汽车内饰件邻域深度值

开户账户风险预测模型的输入参数的获取方法及相关装置

风险预测模型策略账户客户指标

基于数字化模拟场景的数据交互方法及相关装置

验证请求数据数据交互方法信号标识场景

一种机器人路径跟踪方法、设备和存储介质

机器人路径跟踪 Y轴运动短时间坐标系

一种基于大语言模型的老年健康管理指令数据集构建方法

站点导航

APP 下载