摘要
本发明属于数据存储技术领域,涉及一种基于自然语言的语言储存方法。具体包括对待存储自然语言数据进行数据清洗,提取清洗完成的待存储自然语言数据中的所有语句特征的集合;依据不同语句的特征的集合将清洗完成的待存储的自然语言数据分割为多个片段,对每一片段进行特征提取,针对每一片段提取的特征包括主要特征和次要特征;通过训练分类模型来对待存储的自然语言数据中的所有片段的重要性进行划分;依据分类模型对待存储的自然语言数据中片段的重要性判断,选择相应的存储介质和加密方法对该片段进行存储。本发明依据自然语言数据的重要性判断,选择存储方式,保证重要数据的安全性。
技术关键词
自然语言
储存方法
训练分类模型
语句
节点
加密方法
关键词
数据存储技术
特征值
机械硬盘
基准
训练集
汉字
列表
格式化
基础
主题
阻尼
系统为您推荐了相关专利信息
贝叶斯网络模型
电网设备信息
挖掘方法
节点
矩阵
非线性功率放大器
大规模MIMO系统
多输入多输出系统
建立上行链路
接入点
微粒群优化算法
本体匹配方法
术语标准化
度度量方法
实体
毁伤效应
钢框架结构
冲击特征
神经网络模型
染色体