一种基于大语言模型的老年健康管理指令数据集构建方法

AITNT
正文
推荐专利
一种基于大语言模型的老年健康管理指令数据集构建方法
申请号:CN202510067758
申请日期:2025-01-16
公开号:CN120067420A
公开日期:2025-05-30
类型:发明专利
摘要
本发明公开了一种基于大语言模型的老年健康管理指令数据集构建方法,基于网络爬虫等多元获取数据方法,通过数据清洗与过滤获得高质量、专注于老年健康管理问答数据和无监督数据;大语言模型信息抽取阶段,根据无监督文本数据,设计提示词来知识引导与背景知识相关的指令数据;提示大语言模型,对信息抽取形成的问答数据与不同基座模型生成的答案进行语义相似性判断,删除语义差异大、准确性欠佳、领域关联程度低内容;人工评测数据后,基于评测数据与先验知识支持下的投票法训练分类模型,对剩余指令数据进行多重指标的投票,筛选出符合高质量标准数据,构建具备高准确性和领域相关性的指令数据集,为优化老年健康管理智能问答提供精准数据支持。
技术关键词
老年健康管理 数据集构建方法 大语言模型 指令 训练分类模型 答案 语义 无监督 生成提示词 格式 保健养生 爬虫 数据分类 随机森林 样本 基座 分类器 参数 代表
系统为您推荐了相关专利信息
1
一种用于重症监护室的智能AI用电监管系统
重症监护室 监管系统 时序特征 故障预测模型 参数
2
一种汽车内饰件缺陷检测方法及系统
像素点 缺陷检测方法 检测汽车内饰件 邻域 深度值
3
开户账户风险预测模型的输入参数的获取方法及相关装置
风险预测模型 策略 账户 客户 指标
4
基于数字化模拟场景的数据交互方法及相关装置
验证请求数据 数据交互方法 信号 标识 场景
5
一种机器人路径跟踪方法、设备和存储介质
机器人路径跟踪 Y轴 运动 短时间 坐标系
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号