摘要
本发明属于人工智能技术领域,具体涉及一种运动心理多轮对话数据集构建方法。目的在于针对现有技术中单轮问答数据结构简单、多轮对话构建缺乏逻辑性与领域适配性、数据组织形式不利于模型学习等问题,主要方案包括采集与整理运动心理领域的原始单轮问答数据,形成原始单轮问答数据集;基于问题类型分类体系,针对每类问题设计拆分模式及重构规则,生成问题拆分规则库;对原始问答数据进行主题识别与分类后,根据拆分规则生成子问题序列,并重构对应的子答案,形成多轮对话数据;将所述多轮对话数据按结构化格式存储,生成结构化对话数据集。
技术关键词
数据集构建方法
多轮对话
答案
拆分规则
语义角色标注
预训练语言模型
定义
语句
单轮
概念
指代消解技术
双向注意力机制
主题模型
数据组织形式
序列
运动心理学
系统为您推荐了相关专利信息
答案
样本检测方法
计算机程序指令
大语言模型
样本检测系统
人工智能模型
脚本
生成计算机
模型构建方法
大语言模型
语音问答方法
对象
答案
策略
非暂态计算机可读存储介质