摘要
本说明书实施例提供文本处理方法及装置、模型训练方法及装置,其中所述文本处理方法包括:将待处理格式文件转换为文本格式文件,并按照预设的分割符对所述文本格式文件进行分割,获得多个分割文本;确定每个分割文本包含的表格符数量以及每个分割文本对应的表格数量,根据所述表格符数量和所述表格数量在所述多个分割文本中删除丢失表格文本,获得初始基准分割文本;确定所述初始基准分割文本对应的修复提示词,将所述修复提示词和所述初始基准分割文本输入至大语言模型进行文本修复处理,获得目标基准分割文本;将所述目标基准分割文本存储至目标样本集合,其中,所述目标样本集合用于执行模型优化任务。
技术关键词
文本处理方法
表格
训练语言模型
基准
样本
计算机可执行指令
模型训练方法
文本处理装置
关键词
模型训练装置
处理器
计算机程序产品
标签
存储模块
可读存储介质
存储器
数值