摘要
本申请公开了一种心理咨询对话数据集生成方法、装置、设备及存储介质,涉及数据集生成技术领域,该方法包括:获取不同数据源的心理咨询数据,并对心理咨询数据进行数据预处理;基于个案概念化模板生成拓展对话提示信息;将预处理后的心理咨询数据以及拓展对话提示信息输入至预训练大语言模型,获得初始多轮对话数据;对初始多轮对话数据进行标签提取,获得各轮对话的对话标签;根据对话标签对初始多轮对话数据进行标注,生成对话数据集。本申请通过引入个案概念化模板生成提示信息以辅助预训练大语言模型对获取的心理咨询数据进行拓展,能够增强得到的多轮对话数据的逻辑性和有效性,进而在由对话标签标注后得到专业相关性更强的对话数据集。
技术关键词
多轮对话
信息知识图谱
大语言模型
标签
生成程序
生成方法
序列
生成提示信息
生成技术
数据采集模块
模板
措施
生成设备
定义
生成装置
处理器
心理
系统为您推荐了相关专利信息
全景图
高斯混合模型
搜索方法
大语言模型
语义标签
推理系统
多智能体协同
知识点
教学组织形式
学科知识图谱
注意力神经网络
序列
注意力机制
水动力参数
数据特征提取
场景图像处理
多模态
分析方法
计算机可执行指令
安监