文本增强方法及装置、模型训练方法及装置

AITNT
正文
推荐专利
文本增强方法及装置、模型训练方法及装置
申请号:CN202410727064
申请日期:2024-06-05
公开号:CN119150883A
公开日期:2024-12-17
类型:发明专利
摘要
本申请公开了一种文本增强方法及装置、模型训练方法及装置,本申请通过对第一文本进行分词,得到多个第一词汇,再确定与每个第一词汇在发音上具有关联关系的第二词汇,最后将第一文本和多个第二词汇进行文本增强处理,将第一文本中的至少一个第一词汇替换为对应的第二词汇,得到至少一个第二文本。如此,通过将第一文本中的第一词汇用具有发音关联关系的第二词汇来替换,对第一文本进行文本增强,可以在增加训练文本数据的数量和多样性的同时,还能提高训练文本的质量。
技术关键词
模型训练方法 训练样本集 计算机程序产品 训练文本数据 分词 模型训练装置 发音方法 编码 可读存储介质 处理器 关系 模块 参数 存储器 指令 计算机设备 索引
系统为您推荐了相关专利信息
1
针对碳排放因子数据缺失的插值补全方法、装置、设备、存储介质和程序产品
补全方法 因子 训练集 数据存储系统 注意力机制
2
推荐方法、模型训练方法及相关产品
模型训练方法 推荐方法 感兴趣 模型训练装置 计算机程序代码
3
基于搜索词的职位搜索方法、装置、电子设备及存储介质
职位搜索方法 搜索词 扩展检索词 语义 字段
4
景别识别方法、装置、电子设备以及介质
眼部关键点 矫正 画面 图像 识别方法
5
文本特征提取方法、模型训练方法及相关装置
训练样本数据 特征提取模型 文本特征提取方法 标签 强化学习算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号