摘要
本发明涉及云数据压缩与存储优化技术领域,公开了一种面向云服务后台的文件数据优化方法及系统,其中,方法包括:提取语义分片集合;计算相邻Token对的语法树相似度;根据分片词频设定语义熵权重;动态选择最优压缩算法;构建多编码拼接文件;相较于现有技术中通常采用固定行切片、静态压缩字典或单一算法统一压缩的方式,尤其是在面向复杂结构化与半结构化文本文件如日志、配置文件、HTML模板条件下,难以实现高效的语义自适应分片和动态多算法压缩策略的技术问题,由于本申请通过语义熵权重驱动的字典优化机制和滑动窗口热度动态检测,实现了基于语义特征的内容分块和按需动态自适应压缩,提高了云端文件的压缩率和访问性能。
技术关键词
面向云服务
分片
数据优化方法
压缩算法
字典
滑动窗口
数据优化系统
多层注意力
索引
语义结构
词频统计
优化设备
计算机程序产品
分块
标签
编码
复杂度
评价算法
遍历算法
系统为您推荐了相关专利信息
数据恢复方法
分片
分布式存储系统
备份
剩余存储容量