文本增强方法及装置、模型训练方法及装置

正文

推荐专利

文本增强方法及装置、模型训练方法及装置

申请号：CN202410727064

申请日期：2024-06-05

公开号：CN119150883A

公开日期：2024-12-17

类型：发明专利

摘要

本申请公开了一种文本增强方法及装置、模型训练方法及装置，本申请通过对第一文本进行分词，得到多个第一词汇，再确定与每个第一词汇在发音上具有关联关系的第二词汇，最后将第一文本和多个第二词汇进行文本增强处理，将第一文本中的至少一个第一词汇替换为对应的第二词汇，得到至少一个第二文本。如此，通过将第一文本中的第一词汇用具有发音关联关系的第二词汇来替换，对第一文本进行文本增强，可以在增加训练文本数据的数量和多样性的同时，还能提高训练文本的质量。

技术关键词

模型训练方法训练样本集计算机程序产品训练文本数据分词模型训练装置发音方法编码可读存储介质处理器关系模块参数存储器指令计算机设备索引

系统为您推荐了相关专利信息

针对碳排放因子数据缺失的插值补全方法、装置、设备、存储介质和程序产品

补全方法因子训练集数据存储系统注意力机制

推荐方法、模型训练方法及相关产品

模型训练方法推荐方法感兴趣模型训练装置计算机程序代码

基于搜索词的职位搜索方法、装置、电子设备及存储介质

职位搜索方法搜索词扩展检索词语义字段

景别识别方法、装置、电子设备以及介质

眼部关键点矫正画面图像识别方法

文本特征提取方法、模型训练方法及相关装置

训练样本数据特征提取模型文本特征提取方法标签强化学习算法

文本增强方法及装置、模型训练方法及装置

站点导航

APP 下载