摘要
本申请提供的文本压缩序列化方法,应用于计算机设备,包括:提取文本的文本特征,采集计算机设备的资源信息,文本特征包括结构化指数、重复率和语义熵,资源信息包括CPU使用率和剩余内存占比;利用结构化指数和重复率,筛选文本的第一候选压缩算法集,基于资源信息对第一候选压缩算法集过滤后,根据语义熵,选择第二候选压缩算法集后,通过资源信息确定目标候选压缩算法集;基于文本特征和资源信息,计算目标候选压缩算法集中每个候选压缩算法的评分值,将评分值最高的候选压缩算法作为目标压缩算法;采用目标压缩算法对文本压缩后进行序列化,得到压缩序列化文本。如此可以提升文本压缩序列化的灵活性、压缩效果和资源利用率。
技术关键词
压缩算法
序列化方法
文本
计算机设备
计算机可读指令
资源
语义
指数
内存
序列化装置
字典
特征提取模块
处理器
编码
复杂度
自然语言
存储器
格式
系统为您推荐了相关专利信息
系统设计方法
手写签批内容
手写体识别
纠错
错误检测
文本生成模型
文本生成方法
样本
操作界面
可读存储介质
异常数据
逻辑回归模型
计算机可读指令
评估预测模型
优化预测模型