一种基于采样比的文本处理方法

正文

推荐专利

一种基于采样比的文本处理方法

申请号：CN202410996735

申请日期：2024-07-24

公开号：CN118690737B

公开日期：2025-02-07

类型：发明专利

摘要

本发明涉及电数字数据处理技术领域，特别是涉及一种基于采样比的文本处理方法。所述方法包括：获取第i类待采样文本ai，ai包括的待采样文本的数量为qi，ai包括的qi个待采样文本的标签相同；获取第i类的采样数量si；获取第i类的采样比ri，ri=si/qi；如果ri<r0，则根据ai包括的待采样文本之间的文本相似度对ai进行聚类，得到聚类结果Gi；获取Gi中最小簇包括的待采样文本的数量si,min；如果si,min≥f(si/m)，则遍历Gi，从gi,j中获取f(si/m)个待采样文本构成第i类的初始采样文本。本发明提高了经训练的语义分析模型的推理能力。

技术关键词

文本处理方法电数字数据处理技术聚类语义分析模型标签

系统为您推荐了相关专利信息

ETC式数智到货验收方法、装置和系统

定位包装箱指纹模型验收方法定位标签包装箱信息

基于认知与执行相结合的通用机器人操作系统及方法

机器人操作系统视角规划对象图像分割模型

一种基于微信小程序的购物系统及使用方法

购物系统决策模板策略购物车

一种基于大数据的发电企业信用等级评价方法和系统

指标企业初始聚类中心大数据信用等级评价系统

基于纵向联邦学习的模型训练方法、介质、设备及产品

特征提取模型节点参数信息更新通道

一种基于采样比的文本处理方法

站点导航

APP 下载