摘要
本发明涉及人工智能技术领域及医疗健康和金融科技领域,公开了对话数据集生成方法、装置、计算机设备及存储介质,通过获取不同数据源的心理咨询数据,对心理咨询数据进行数据预处理,得到目标心理咨询数据;按照不同的心理咨询问题对目标心理咨询数据进行内容分类,得到目标数据;基于目标数据,对其中相同心理咨询问题下的每条心理咨询对话数据,逐句改写心理咨询师的对话内容,得到第一对话数据集;基于目标数据,对其中相同心理咨询问题下的每条心理咨询对话数据,整体改写全部对话内容,得到第二对话数据集;基于第一对话数据集和第二对话数据集,构建心理咨询数据的目标对话数据集;本发明可生成高质量的心理咨询对话数据集。
技术关键词
数据
生成方法
内容分类
大语言模型
计算机设备
策略
可读存储介质
人工智能技术
医疗健康
处理器
生成装置
同义词
模块
格式化
存储器
语句
金融
心理
文本