摘要
本公开涉及一种文本的信息量评估方法、装置、设备及介质,该方法包括:获取待评估的目标文本;确定目标文本中每个分词文本的出现概率,并基于各分词文本的出现概率确定目标文本的原始信息熵;基于目标文本的文本长度和修正系数,对原始信息熵进行修正,得到目标信息熵;根据预先确定的评估阈值对目标信息熵进行标准化。本公开能够提高信息量评估的计算效率和准确性。
技术关键词
信息熵
概率分布函数
分布特征
统计算法
样本
文本分类模型
可读存储介质
终端设备
分词算法
评估装置
指令
电子设备
处理器
模块
存储器
计算机
系统为您推荐了相关专利信息
信号处理方法
全局结构信息特征
图像
滚动轴承
模式