摘要
本申请涉及数据分析技术领域,具体涉及一种记忆库文件属性的批量统计分析方法及系统,该方法包括:统计翻译记忆库中翻译单元的存储信息的各属性及其属性值;基于各属性下所有属性值的相关关系将各属性的所有属性值划分为各属性数据块;根据各属性下各属性值的出现频次确定各属性值的需求频率;构建各属性值的选择概率;确定对各属性数据块进行差分字典压缩时动态字典中的初始字符串;获取各属性的类间差异;确定各属性数据块的调整比例;基于各属性数据块内各属性值的编码长度,得到对各属性数据块进行差分字典压缩时的差分阈值,将压缩后的属性数据块进行有序存储。从而提高对属性值进行检索响应时的响应速度。
技术关键词
统计分析方法
记忆
批量
动态字典
编码
统计分析系统
数据分析技术
频率
聚类算法
参数
处理器
信息熵
编辑
关系
存储器
字符
数值
系统为您推荐了相关专利信息
光伏系统
浮空平台
能源管理方法
无线能量传输系统
轻质光伏组件