摘要
本发明公开了涉及一种人机对话系统的训练方法、装置和电子设备,属于人机对话技术领域。该方法包括:获取训练数据;将问题和回答输入至后验检索模型并输出若干个相关文本;从若干个相关文本中筛选出符合后验检索模型的概率要求的多个样本;进行MIS采样,得到第t次采样的优质样本;利用训练数据和优质样本训练人机对话系统,得到训练好的人机对话系统。通过在RAG人机对话系统中采用联合随机近似方法来进行半监督训练,提升了对于无标数据的利用率,进而提升了人机对话系统的性能。同时,能够通过JSA算法来端到端的训练整个RAG人机对话系统。
技术关键词
人机对话系统
样本
人机对话方法
训练装置
训练语言模型
文本编码器
人机对话技术
采样模块
半监督训练
电子设备
数据获取模块
处理器
存储器
指令
算法
系统为您推荐了相关专利信息
隧道掌子面
灾害预警方法
机器学习模型
不良地质体
地质结构
图像分类方法
注意力机制
残差网络
特征提取模块
输出特征
定位检测方法
焦点损失函数
多维特征向量
成像
热异常检测