摘要
本公开实施例提供一种文档处理方法、装置、电子设备及存储介质,通过获取待处理文本,并对待处理文本进行处理,得到包含多个待处理词源的有序词源集;通过组合识别模型处理待处理词源,得到待处理文本对应的异常词,异常词为在待处理文本中未进行解释的不易理解词;基于异常词,生成对应的注释信息,注释信息至少用于指示异常词在待处理文本中的位置。通过将待处理文件分解为待处理词源,并通过组合识别模型对待处理词源进行检测和识别,确定待处理文本中的异常词,并生成对应的注释信息,实现对待处理文本中异常词的高效检测和识别,提高异常词检测效率,进而提高针对文档进行编辑和处理的效率和质量,提高用户使用体验。
技术关键词
文本
计算机执行指令
电子设备
处理器
可读存储介质
计算机程序产品
语义特征
存储器
白名单
识别模块
互联网
数据
编辑
列表
场景
系统为您推荐了相关专利信息
算法
音频数据处理方法
音频数据处理装置
精度校准
分片
计算机辅助设计模型
实测参数
数据采集模块
多关节机械臂
机械臂运动学
参数保护方法
人工智能模型
探针
水印嵌入
特征值
风险主体
风险评分模型
风险量化评估方法
舆情文本
网络