摘要
本发明公开了基于人工智能的进阶语言沟通辅助训练数据管理系统,包括:锚点问答获取模块、沟通样本集获取模块、无监督训练模块、训练样本生成模块,根据所述伪标签生成模型,生成若干高质量问答训练样本;其中,高质量问答训练样本的目标标签由所述第二正面回答作为目标变量,表征为高质量回答的伪标签;训练数据定义模块,用于将若干高质量问答训练样本定义为所述进阶语言沟通的有监督训练数据;本发明能够根据输入的实时提问,利用模型生成高质量回答,并将其作为目标标签进行伪标注,从而替代人工标注过程。并且其自动生成高质量回答的目标标签,通过无监督学习机制学习高质量沟通问答,能够大幅提高进阶语言沟通质量。
技术关键词
辅助训练数据
样本
管理系统
语义
标签
正面
锚点
定义
更新模型参数
模块
无监督学习
梯度下降法
变量
文本
表达式
机制
数值