摘要
本申请实施例了提供一种开放问答模型生成方法和装置,所述方法包括:获取训练数据,训练数据具备避免偏置的特点;获取初始开放问答模型,所述初始开放问答模型包含多层Transformer模型和向量转换模块;所述向量转换模块支持分别对中文类数据和非中文类数据进行独立处理;通过向量转换模块对训练数据进行分词处理得到一个或多个分词,并对所述一个或多个分词进行特征提取得到每一个分词对应的特征向量;根据特征向量训练所述初始开放问答模型得到目标开放问答模型。通过设置模型架构中包含多层Transformer模型和向量转换模块,向量转换模块可以提升模型从输入数据中所提取特征的效果,适当增加模型的深度可以提升模型的表现,使得模型可以更为精准地理解用户意图。
技术关键词
问答模型
生成方法
分词
启发式规则
模型训练模块
可读存储介质
特征提取模块
数据获取模块
计算机程序产品
数值
处理器通信
生成装置
指令
计算机设备
存储器
阶段
系统为您推荐了相关专利信息
样本
损伤预测方法
模型训练模块
数据获取模块
训练系统
车载显示屏
样本
机器可读指令
模型训练模块
亮度
信息生成方法
大语言模型
信息生成装置
关键词
人工智能技术