一种基于采样比的文本处理方法

AITNT
正文
推荐专利
一种基于采样比的文本处理方法
申请号:CN202410996735
申请日期:2024-07-24
公开号:CN118690737B
公开日期:2025-02-07
类型:发明专利
摘要
本发明涉及电数字数据处理技术领域,特别是涉及一种基于采样比的文本处理方法。所述方法包括:获取第i类待采样文本ai,ai包括的待采样文本的数量为qi,ai包括的qi个待采样文本的标签相同;获取第i类的采样数量si;获取第i类的采样比ri,ri=si/qi;如果ri<r0,则根据ai包括的待采样文本之间的文本相似度对ai进行聚类,得到聚类结果Gi;获取Gi中最小簇包括的待采样文本的数量si,min;如果si,min≥f(si/m),则遍历Gi,从gi,j中获取f(si/m)个待采样文本构成第i类的初始采样文本。本发明提高了经训练的语义分析模型的推理能力。
技术关键词
文本处理方法 电数字数据处理技术 聚类 语义分析模型 标签
系统为您推荐了相关专利信息
1
ETC式数智到货验收方法、装置和系统
定位包装箱 指纹模型 验收方法 定位标签 包装箱信息
2
基于认知与执行相结合的通用机器人操作系统及方法
机器人操作系统 视角 规划 对象 图像分割模型
3
一种基于微信小程序的购物系统及使用方法
购物系统 决策 模板 策略 购物车
4
一种基于大数据的发电企业信用等级评价方法和系统
指标 企业 初始聚类中心 大数据 信用等级评价系统
5
基于纵向联邦学习的模型训练方法、介质、设备及产品
特征提取模型 节点 参数 信息更新 通道
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号