一种文本纠正方法及装置

正文

推荐专利

一种文本纠正方法及装置

申请号：CN202411546772

申请日期：2024-11-01

公开号：CN119047437B

公开日期：2025-02-18

类型：发明专利

摘要

本发明提供一种文本纠正方法及装置，所述方法包括：对当前文档进行预处理，构建当前文档的词汇表；将当前文档的词汇表输入至预先训练完成的Word2Vec模型，提取词汇表中每一词汇的Word2Vec词向量；并且，在预设文档集合下，利用TF‑IDF算法计算每个文档中所述每一词汇对应的TF‑IDF值，构建所述每一词汇的TF‑IDF特征向量；对所述每一词汇的TF‑IDF特征向量和Word2Vec词向量进行向量特征融合形成所述每一词汇的向量表示；根据所述每一词汇的向量表示，在预设数据库中匹配对应的目标错误词；利用目标错误词对应的规范词，对当前文档中的所述每一词汇进行替换，以实现对当前文档的文本纠正。本发明大幅度提高了文本编辑效率，有效降低了文本的编校质量差错率。

技术关键词

文本纠正方法非暂态计算机可读存储介质加权特征词语纠正装置特征提取模块处理器算法差错率匹配模块语义存储器电子设备频率分词

系统为您推荐了相关专利信息

一种多元时间序列异常检测扩散模型动态分割方法及系统

动态分割方法多元时间序列数据高性能分割算法网络

基于物联网与数字孪生的城市中枢智能决策方法及系统

智能决策方法数字孪生模型板块交通运行状态空气质量指数

器械分割方法、装置、设备、存储介质及程序产品

器械类别分割方法非暂态计算机可读存储介质语音特征提取语音编码器

基于策略评估网络学习的半监督训练方法、语音识别方法及装置

策略网络语音识别方法非暂态计算机可读存储介质符号

考虑因果关系和时序特征的连锁故障快速筛选方法及系统

故障场景时序特征快速筛选方法蒙特卡罗抽样方法神经网络模型

一种文本纠正方法及装置

站点导航

APP 下载