摘要
本申请涉及一种文本识别方法、装置、计算机设备和可读存储介质。方法包括:获取待检测文本和关联关系信息;根据待检测文本和关联关系信息,生成文本连通图;迭代更新文本连通图,并根据迭代更新后的文本连通图,生成待检测文本对应的目标文本特征;通过对多个待检测文本的目标文本特征进行聚类,从多个待检测文本中识别语义重复的目标文本。采用本方法能够准确进行文本识别。
技术关键词
关键词
节点
文本识别方法
关系
分词
计算机设备
词语
文本识别装置
频率
信息更新
计算机程序产品
聚类
远距离
处理器
语义
网络
可读存储介质
模块
系统为您推荐了相关专利信息
采集管理方法
分层现象
数据采集序列
训练集数据
RNN模型
关联规则挖掘算法
贝叶斯分类算法
时间序列预测模型
样本
强化学习模型
节点
数据格式
可读存储介质
终端设备
大语言模型
深度Q网络
任务分配方法
节点
资源
任务分配装置