文本数据处理方法、装置、计算机设备、可读存储介质和程序产品

正文

推荐专利

申请号：CN202510105544

申请日期：2025-01-22

公开号：CN120012770A

公开日期：2025-05-16

类型：发明专利

摘要

本申请涉及一种文本数据处理方法、装置、计算机设备、可读存储介质和程序产品。所述方法包括：通过目标文本对应的目标语言类型的模型权重对训练好的基础文本模型的权重进行更新，得到目标文本模型；训练好的基础文本模型是通过目标数据集以及目标训练方式进行训练后得到；通过目标文本模型对目标文本进行处理，得到对应目标语言类型的目标文本。通过采用本方法，提升了模型的泛化能力以及在不同语言的适应程度，在确定目标文本的目标语言类型对应的模型权重与预先训练好的文本处理模型合并后进行数据处理，可以在离线状态的情况下快速生成高质量的文本处理结果，保障多语言文本处理的灵活性。

技术关键词

文本数据处理方法大语言模型字符风格文本数据处理装置基础计算机设备文本处理模型可读存储介质指令计算机程序产品处理器多语言蒸馏超参数存储器模块

系统为您推荐了相关专利信息

基于多维度答案筛选的低资源语言开放域问答方法

低资源语言答案大语言模型问答方法英语

基于深度学习的票据OCR识别方法

票据 OCR识别方法峰值信噪比建立识别模型图像

无人巴士路径规划方法、装置、设备及存储介质

无人巴士局部路径规划环境感知信息路径规划方法全局路径规划

基于大语言模型的上下文偏好学习方法、装置及设备

强化学习代理大语言模型学习方法评分机制指标

测试节点与测试数据的生成系统、方法及存储介质

节点生成系统生成测试数据智能路径规划生成模板

文本数据处理方法、装置、计算机设备、可读存储介质和程序产品

站点导航

APP 下载