摘要
本申请实施例提供了一种文本识别方法、装置、电子设备及存储介质,包括:对待识别文本的分词数据进行哈希运算,得到所述分词数据对应的第一哈希值;判断所述第一哈希值与数据库中存储的第二哈希值是否匹配成功;若所述第一哈希值与所述第二哈希值匹配失败,则使用词嵌入模型和注意力机制对所述分词数据进行处理,得到所述分词数据对应的敏感相似度;根据所述敏感相似度确定所述分词数据是否为敏感数据;若所述分词数据为敏感数据,则使用蒸馏模型和条件随机场模型对所述敏感数据进行分类,获得所述敏感数据的分类结果,以解决目前无法识别出潜在的敏感信息,从而存在较多漏判、误判现象、准确率较低的问题。
技术关键词
分词
条件随机场模型
文本识别方法
词嵌入模型
注意力机制
蒸馏
多层次
文本识别装置
滑动窗口
标签数据库
电子设备
误判现象
可读存储介质
处理器
学生
教师
模块
系统为您推荐了相关专利信息
光学相干断层扫描
融合图像特征
多模态
图像增强模型
网络结构
贝叶斯神经网络
深度融合网络
可见光图像
融合特征
诊断方法
多模态
意图
文本编码器
参数
Softmax函数
感知检测方法
可见光视频
特征提取模块
融合特征
多场景
时空注意力机制
雷电预测方法
卫星云图
预测系统
网格