摘要
本申请提供一种基于多模态技术的联机手写文本切分方法、系统及存储介质,包括:多模态数据同步采集:获取联机手写文本的轨迹序列数据及其对应的手写文本图像数据;双模态协同预测:基于所述轨迹序列数据通过区域边界回归模型预测字符边界,获取单字符的区域边界结果,同时基于所述手写文本图像数据通过字符检测分类模型预测检测框及字符类别,获取单字符的区域边界结果;状态感知联合修正:融合所述双模态协同预测的结果,结合轨迹序列中的书写状态特征,生成优化后的字符切分结果。本申请能够有效地解决现有技术中字符或词语边界的确定因手写文本的连笔与潦草而导致的切分准确率问题。
技术关键词
文本切分方法
多模态技术
检测分类模型
字符
双模态
序列
卷积特征提取
神经网络架构
轨迹
数据同步
注意力机制
损失函数优化
切分系统
阈值机制
图像
分阶段
切分装置
系统为您推荐了相关专利信息
交互式学习
智能显示屏
立板
语音识别模块
广角摄像头
知识图谱构建系统
推理算法
症状向量
同义词库
关系网络