摘要
本发明涉及商务信息咨询技术领域,且公开了一种商务信息咨询系统的数据存储方法,包括:S1、数据获取与解析;S2、字符频率统计;S3、字符组合生成;S4、影响因子计算;S5、字符列表生成;S6、编码压缩;S7、分布式存储。该商务信息咨询系统的数据存储方法及系统,数据获取模块解析对话数据生成字符序列后,频率分析模块统计第一概率,字符组合处理模块用滑动窗口提取高频三字符组合并合并成多级集合,影响因子计算模块结合共现与全局频率调整第二概率,列表生成模块依前置概率排序生成字符列表,编码压缩模块通过移动到前端算法动态调序,以减少编码量、提升压缩效率,降低存储空间占用。
技术关键词
数据存储方法
二进制算术编码
数据存储系统
列表
NameNode节点
存储管理模块
商务信息咨询技术
滑动窗口算法
频率
分布式文件系统
数据生成字符
序列
动态概率模型
数据获取模块
硬件加速技术
因子