文本数据处理方法、装置、计算机设备、可读存储介质和程序产品

AITNT
正文
推荐专利
文本数据处理方法、装置、计算机设备、可读存储介质和程序产品
申请号:CN202510105544
申请日期:2025-01-22
公开号:CN120012770A
公开日期:2025-05-16
类型:发明专利
摘要
本申请涉及一种文本数据处理方法、装置、计算机设备、可读存储介质和程序产品。所述方法包括:通过目标文本对应的目标语言类型的模型权重对训练好的基础文本模型的权重进行更新,得到目标文本模型;训练好的基础文本模型是通过目标数据集以及目标训练方式进行训练后得到;通过目标文本模型对目标文本进行处理,得到对应目标语言类型的目标文本。通过采用本方法,提升了模型的泛化能力以及在不同语言的适应程度,在确定目标文本的目标语言类型对应的模型权重与预先训练好的文本处理模型合并后进行数据处理,可以在离线状态的情况下快速生成高质量的文本处理结果,保障多语言文本处理的灵活性。
技术关键词
文本数据处理方法 大语言模型 字符 风格 文本数据处理装置 基础 计算机设备 文本处理模型 可读存储介质 指令 计算机程序产品 处理器 多语言 蒸馏 超参数 存储器 模块
系统为您推荐了相关专利信息
1
基于多维度答案筛选的低资源语言开放域问答方法
低资源语言 答案 大语言模型 问答方法 英语
2
基于深度学习的票据OCR识别方法
票据 OCR识别方法 峰值信噪比 建立识别模型 图像
3
无人巴士路径规划方法、装置、设备及存储介质
无人巴士 局部路径规划 环境感知信息 路径规划方法 全局路径规划
4
基于大语言模型的上下文偏好学习方法、装置及设备
强化学习代理 大语言模型 学习方法 评分机制 指标
5
测试节点与测试数据的生成系统、方法及存储介质
节点 生成系统 生成测试数据 智能路径规划 生成模板
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号