一种基于多模态技术的联机手写文本切分方法、系统及存储介质

AITNT
正文
推荐专利
一种基于多模态技术的联机手写文本切分方法、系统及存储介质
申请号:CN202510684419
申请日期:2025-05-26
公开号:CN120599621A
公开日期:2025-09-05
类型:发明专利
摘要
本申请提供一种基于多模态技术的联机手写文本切分方法、系统及存储介质,包括:多模态数据同步采集:获取联机手写文本的轨迹序列数据及其对应的手写文本图像数据;双模态协同预测:基于所述轨迹序列数据通过区域边界回归模型预测字符边界,获取单字符的区域边界结果,同时基于所述手写文本图像数据通过字符检测分类模型预测检测框及字符类别,获取单字符的区域边界结果;状态感知联合修正:融合所述双模态协同预测的结果,结合轨迹序列中的书写状态特征,生成优化后的字符切分结果。本申请能够有效地解决现有技术中字符或词语边界的确定因手写文本的连笔与潦草而导致的切分准确率问题。
技术关键词
文本切分方法 多模态技术 检测分类模型 字符 双模态 序列 卷积特征提取 神经网络架构 轨迹 数据同步 注意力机制 损失函数优化 切分系统 阈值机制 图像 分阶段 切分装置
系统为您推荐了相关专利信息
1
一种基于重复输出的大模型海绵样本黑盒生成方法
样本 海绵 字符 生成方法 集成学习策略
2
一种交互式学习设备及其使用方法
交互式学习 智能显示屏 立板 语音识别模块 广角摄像头
3
文档摘要的提取方法、系统、电子设备及存储介质
摘要 光学字符识别 文本 序列 语义
4
基于改进梯度提升的眼科导诊知识图谱构建系统
知识图谱构建系统 推理算法 症状向量 同义词库 关系网络
5
一种基于5G通信的远程在线直播方法及系统
在线直播方法 码率 视频流 视频帧 音频
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号