摘要
本申请公开了一种文本增强方法及装置、模型训练方法及装置,本申请通过对第一文本进行分词,得到多个第一词汇,再确定与每个第一词汇在发音上具有关联关系的第二词汇,最后将第一文本和多个第二词汇进行文本增强处理,将第一文本中的至少一个第一词汇替换为对应的第二词汇,得到至少一个第二文本。如此,通过将第一文本中的第一词汇用具有发音关联关系的第二词汇来替换,对第一文本进行文本增强,可以在增加训练文本数据的数量和多样性的同时,还能提高训练文本的质量。
技术关键词
模型训练方法
训练样本集
计算机程序产品
训练文本数据
分词
模型训练装置
发音方法
编码
可读存储介质
处理器
关系
模块
参数
存储器
指令
计算机设备
索引
系统为您推荐了相关专利信息
模型训练方法
推荐方法
感兴趣
模型训练装置
计算机程序代码
训练样本数据
特征提取模型
文本特征提取方法
标签
强化学习算法