一种文本的平滑采样方法、装置、电子设备及存储介质

AITNT
正文
推荐专利
一种文本的平滑采样方法、装置、电子设备及存储介质
申请号:CN202410997376
申请日期:2024-07-24
公开号:CN118690022B
公开日期:2025-12-05
类型:发明专利
摘要
本发明涉及电数字数据处理技术领域,特别是涉及一种文本的平滑采样方法、装置、电子设备及存储介质。所述方法包括:S100,获取待采样文本集A,A包括若干类待采样文本,同一类待采样文本的标签相同,不同类待采样文本的标签不同;S200,获取第i类的采样数量si;S300,如果qi≥si,则从第i类待采样文本ai中获取si个待采样文本构成第i类的目标采样文本;否则,将ai确定为第i类的目标采样文本。本发明能够提高采样得到的文本中不同标签对应的文本的数量分布与待采样文本中不同标签对应的文本的数量分布的一致性,以及提高基于采样得到的文本训练得到的语义分析模型对那些对应的文本数量较少的标签的推理能力。
技术关键词
文本 采样方法 采样装置 聚类 电数字数据处理技术 标签 语义分析模型 模块 电子设备 可读存储介质 处理器 存储器 计算机 序列
系统为您推荐了相关专利信息
1
一种工程招标文件切分与聚合查询方法、系统及程序产品
分块 查询主题 查询方法 分词 注意力
2
一种短视频用户生成内容与IP创意的整合方法和系统
音频特征数据 元素 视觉特征 语义特征 多模态
3
病历生成方法及装置
地点 状态转移算法 高层语义特征 病历 文本生成模型
4
融合空间表征的说话人日志分析方法、系统及存储介质
日志分析方法 语音活动检测 音频 多通道 带时间
5
一种基于语音对话的电力客服工单摘要生成方法和系统
电力客服工单 摘要生成方法 语音文本处理 摘要生成系统 电力服务系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号