摘要
本申请公开了一种基于NLP处理的文本可读性分析方法、系统及电子设备,该方法通过提取多个人物角色实体;将预处理后的待分析文本进行分词处理,得到词语序列,并构建依存句法树;基于多个人物角色实体、预处理后的待分析文本和依存句法树,提取角色数量特征、角色性格多样性熵特征、冲突密度特征、对话占比特征、关系密度特征以及关系复杂度特征;将角色数量特征、角色性格多样性熵特征、冲突密度特征、对话占比特征、关系密度特征以及关系复杂度特征进行特征处理和融合,得到融合后的特征向量;将融合后的特征向量输入编码器中,得到初步评分向量;根据初步评分向量,确定待分析文本的可读性评分。本申请能够提高文本可读性分析的准确度。
技术关键词
复杂度特征
依存句法树
分析方法
文本可读性分析
密度
实体
关系抽取模型
词语
计算机可执行指令
编码器
特征提取单元
三元组
电子设备
可读存储介质
数据处理单元
分词
序列
处理器
系统为您推荐了相关专利信息
矿产资源潜力评价方法
克里金插值算法
地质勘探数据
厚度网格
代表
数据可视化方法
密度峰值聚类算法
样本
指标
降维方法
净初级生产力
植被
森林生物量
相关性统计分析
土壤有机碳密度
时频重叠信号
信号特征值
多信号
匹配追踪算法
估计方法
Kriging模型
可靠性分析算法
训练样本集
策略
多项式