训练数据生成方法、模型训练方法、装置、设备及介质

AITNT
正文
推荐专利
训练数据生成方法、模型训练方法、装置、设备及介质
申请号:CN202410719712
申请日期:2024-06-05
公开号:CN118297189B
公开日期:2024-08-09
类型:发明专利
摘要
本申请提供了一种训练数据生成方法、模型训练方法、装置、设备及介质,属于自然语言处理技术领域。训练数据生成方法包括:根据初始文本数据,确定多个版块数据;确定各个版块数据与初始文本数据之间的第一关联关系以及多个版块数据之间的第二关联关系;根据第一关联关系和第二关联关系,确定多个版块数据的排版信息;基于排版信息对多个版块数据进行排版,得到目标文本数据;根据初始文本数据、目标文本数据以及目标文本数据中的版块数据与初始文本数据的映射关系,得到训练数据。根据本申请的实施例能够较为便捷地得到合理性和准确性相对较高的训练数据,在利用该训练数据训练识别模型时,可以有效提高训练效果。
技术关键词
训练数据生成方法 文本 排版信息 语义特征 模型训练方法 关系 计算机可读代码 语句 训练识别模型 数据生成装置 电子设备 可读存储介质 计算机程序产品 处理器通信 邮件 词语 自然语言
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号