一种本地存档相关数据快速压缩方法

正文

推荐专利

一种本地存档相关数据快速压缩方法

申请号：CN202410841631

申请日期：2024-06-26

公开号：CN118708558B

公开日期：2025-03-21

类型：发明专利

摘要

本发明涉及数据处理技术领域，具体涉及一种本地存档相关数据快速压缩方法，包括：将任意一个词语的所有其他词语划分为相似度高的簇和相似度低的簇；根据文本中任意一个词语与相似度高和相似度低的簇中每个词语语义之间的相似度以及每个词语出现的频率，得到每个词语在文本中的重要性；根据文本中任意两个词语同时出现的频次以及所有词语的数量，得到文本中任意两个词语同时出现的概率值；根据文本中任意两个词语同时出现的频次、概率值以及每个词语的频率权重系数，得到文本中每个词语频率权重指标；根据文本中每个词语频率权重指标调整每个词语出现的频率，构建哈夫曼树进行数据压缩。本发明提高了文本数据的压缩效率。

技术关键词

词语文本频率语义数据压缩指标度度量方法滑动窗口数据处理技术编码

系统为您推荐了相关专利信息

一种基于nltk的知识切分检索系统

检索系统权限控制机制度计算方法机器学习模型可视化界面

基于语义信息引导扩散模型的自主导航建图系统及方法

机器人网络注意力建图系统策略

证件抽取大模型的强化学习方法、装置、设备及可读介质

证件图像强化学习方法文本策略字段

一种基于安卓智能终端跨系统同屏控制操作的方法

安卓智能终端跨系统控制工具屏幕画面

对话大模型流式输出内容安全修正方法及相关装置

修正方法文本非暂态计算机可读存储介质预训练语言模型对象

一种本地存档相关数据快速压缩方法

站点导航

APP 下载