摘要
本申请涉及人工智能,提供一种文本处理模型的训练方法、电子设备及程序产品。训练方法包括:基于第一文本中的每个语句的每个字符的编码,对每个语句进行重排序,其中,第二文本包括多个语句;在第二文本中根据所述多个语句的位置顺序选取第一预设数量的第一语句构建文本列表;在文本列表中选取第二预设数量的第一语句作为第二语句;根据第二文本中第三语句与第二语句的相似度,选择与第二语句相似度小于预设阈值的第三语句添加至文本列表得到更新后的文本列表,通过对更新后的文本列表中的语句进行词汇替换,及基于词汇替换后的文本,训练第一模型。该方法能够提高模型的泛化能力。
技术关键词
语句
文本处理模型
列表
标签
计算机程序产品
时间段
字符
电子设备
字段
处理器
语义
存储器
编码
聚类
标识
数据