文本处理模型的训练方法、电子设备及程序产品

正文

推荐专利

申请号：CN202511143736

申请日期：2025-08-15

公开号：CN120633741B

公开日期：2025-11-11

类型：发明专利

摘要

本申请涉及人工智能，提供一种文本处理模型的训练方法、电子设备及程序产品。训练方法包括：基于第一文本中的每个语句的每个字符的编码，对每个语句进行重排序，其中，第二文本包括多个语句；在第二文本中根据所述多个语句的位置顺序选取第一预设数量的第一语句构建文本列表；在文本列表中选取第二预设数量的第一语句作为第二语句；根据第二文本中第三语句与第二语句的相似度，选择与第二语句相似度小于预设阈值的第三语句添加至文本列表得到更新后的文本列表，通过对更新后的文本列表中的语句进行词汇替换，及基于词汇替换后的文本，训练第一模型。该方法能够提高模型的泛化能力。

技术关键词

语句文本处理模型列表标签计算机程序产品时间段字符电子设备字段处理器语义存储器编码聚类标识数据

系统为您推荐了相关专利信息

超参数搜索过程中的算子优化处理方法、电子装置及计算机程序产品

超参数启发式算法计算机程序产品计数器策略

基于配置生成海量数据库表测试数据的方法以及装置

生成模板生成测试数据生成规则表达式语句

一种面向敏感信息的数据增强方法、系统、设备及介质

敏感信息数据命名实体识别序列标签文本

基于用户行为的母婴产品动态推荐方法及系统

动态推荐方法阶段结构化数据格式因子同步性

一种基于脑电信号的手指动作精度实时反馈模型构建方法

模型构建方法精度电信号数据验证频域特征

文本处理模型的训练方法、电子设备及程序产品

站点导航

APP 下载