一种本地存档相关数据快速压缩方法

AITNT
正文
推荐专利
一种本地存档相关数据快速压缩方法
申请号:CN202410841631
申请日期:2024-06-26
公开号:CN118708558B
公开日期:2025-03-21
类型:发明专利
摘要
本发明涉及数据处理技术领域,具体涉及一种本地存档相关数据快速压缩方法,包括:将任意一个词语的所有其他词语划分为相似度高的簇和相似度低的簇;根据文本中任意一个词语与相似度高和相似度低的簇中每个词语语义之间的相似度以及每个词语出现的频率,得到每个词语在文本中的重要性;根据文本中任意两个词语同时出现的频次以及所有词语的数量,得到文本中任意两个词语同时出现的概率值;根据文本中任意两个词语同时出现的频次、概率值以及每个词语的频率权重系数,得到文本中每个词语频率权重指标;根据文本中每个词语频率权重指标调整每个词语出现的频率,构建哈夫曼树进行数据压缩。本发明提高了文本数据的压缩效率。
技术关键词
词语 文本 频率 语义 数据压缩 指标 度度量方法 滑动窗口 数据处理技术 编码
系统为您推荐了相关专利信息
1
一种基于nltk的知识切分检索系统
检索系统 权限控制机制 度计算方法 机器学习模型 可视化界面
2
基于语义信息引导扩散模型的自主导航建图系统及方法
机器人 网络 注意力 建图系统 策略
3
证件抽取大模型的强化学习方法、装置、设备及可读介质
证件图像 强化学习方法 文本 策略 字段
4
一种基于安卓智能终端跨系统同屏控制操作的方法
安卓智能终端 跨系统 控制工具 屏幕 画面
5
对话大模型流式输出内容安全修正方法及相关装置
修正方法 文本 非暂态计算机可读存储介质 预训练语言模型 对象
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号