一种基于多模态技术的联机手写文本切分方法、系统及存储介质

正文

推荐专利

申请号：CN202510684419

申请日期：2025-05-26

公开号：CN120599621A

公开日期：2025-09-05

类型：发明专利

摘要

本申请提供一种基于多模态技术的联机手写文本切分方法、系统及存储介质，包括：多模态数据同步采集：获取联机手写文本的轨迹序列数据及其对应的手写文本图像数据；双模态协同预测：基于所述轨迹序列数据通过区域边界回归模型预测字符边界，获取单字符的区域边界结果，同时基于所述手写文本图像数据通过字符检测分类模型预测检测框及字符类别，获取单字符的区域边界结果；状态感知联合修正：融合所述双模态协同预测的结果，结合轨迹序列中的书写状态特征，生成优化后的字符切分结果。本申请能够有效地解决现有技术中字符或词语边界的确定因手写文本的连笔与潦草而导致的切分准确率问题。

技术关键词

文本切分方法多模态技术检测分类模型字符双模态序列卷积特征提取神经网络架构轨迹数据同步注意力机制损失函数优化切分系统阈值机制图像分阶段切分装置

系统为您推荐了相关专利信息

一种基于重复输出的大模型海绵样本黑盒生成方法

样本海绵字符生成方法集成学习策略

一种交互式学习设备及其使用方法

交互式学习智能显示屏立板语音识别模块广角摄像头

文档摘要的提取方法、系统、电子设备及存储介质

摘要光学字符识别文本序列语义

基于改进梯度提升的眼科导诊知识图谱构建系统

知识图谱构建系统推理算法症状向量同义词库关系网络

一种基于5G通信的远程在线直播方法及系统

在线直播方法码率视频流视频帧音频

一种基于多模态技术的联机手写文本切分方法、系统及存储介质

站点导航

APP 下载