摘要
本发明公开了一种内容标准化方法、装置及设备。该方法通过对获取的待处理内容进行特征提取,得到待处理内容的第一文本特征;确定第一文本特征与至少一个文本特征集中所包括的各第二文本特征之间的相似度值,一个文本特征集对应一个预设的基准内容集合,文本特征集中所包括的各第二文本特征分别与基准内容集合中包括的基准内容对应;基于各相似度值,确定各第二文本特征所对应基准内容分别与待处理内容之间的相似得分;根据预设筛选数量和相似得分确定候选基准内容,根据第一文本特征和候选基准内容,确定待处理内容的目标基准内容。利用该方法,聚焦候选基准内容间的差异,从候选基准内容中确定出目标基准内容,提高了内容标准化的准确性和效率。
技术关键词
文本
基准
样本
数据采样单元
标准化方法
编码
标准化装置
标记
训练集
前馈神经网络
特征提取模块
本子
处理器通信
存储器
电子设备
参数
系统为您推荐了相关专利信息
障碍物
车位检测方法
样本生成方法
区域图像识别
视觉
特征提取模块
情绪识别方法
融合特征
知识图谱构建
解码器
航空
线性回归模型
性能退化模型
参数
密封圈老化
电机冷却控制系统
故障诊断功能
预测系统故障
故障诊断模块
水泵控制器