一种基于生僻字的标准化处理方法及系统

正文

推荐专利

一种基于生僻字的标准化处理方法及系统

申请号：CN202510025748

申请日期：2025-01-08

公开号：CN119416742B

公开日期：2025-05-16

类型：发明专利

摘要

本发明公开了一种基于生僻字的标准化处理方法及系统，涉及字符识别处理技术领域，包括，获取输入文本数据进行预处理并统一文本数据格式，建立标准化字典表进行疑似生僻字标记；基于疑似生僻字标记提取多模态文字特征综合识别生僻字，转化已识别的生僻字，并将未识别的生僻字形成列表输出；展示生僻字识别结果并将识别结果进行存储。本发明通过获取用户输入文本数据进行预处理并标记疑似生僻字，降低生僻字识别处理量，提高识别效率，同时通过提取生僻字多模态特征向量进行生僻字综合识别，大幅提高生僻字识别准确性和灵活性，实现了生僻字的精准识别和提取。

技术关键词

字符上下文特征文字特征拼音文本字典表标记二叉树结构多模态数据格式生成工具形态特征提取模型词向量模型列表常用汉字分词算法

系统为您推荐了相关专利信息

一种基于语义分析的用药冲突分析方法

冲突分析方法语义特征提取特征提取模块语义分析模型 LSTM神经网络

一种基于发布内容和用户关系融合的社交机器人检测方法

关系网络文本节点特征社交机器人数据项

一种基于大语言模型的新型网络案件非结构化数据关系分析方法

数据关系分析方法大语言模型案件自定义模型 BERT模型

图像处理方法、装置、电子设备和存储介质

深度学习模型文本样本元素生成表格数据

闲置土地识别方法、装置、设备及存储介质

分类器半监督学习旋转森林算法置信度阈值标签特征

一种基于生僻字的标准化处理方法及系统

站点导航

APP 下载