摘要
本申请公开了一种手写记录转换方法及相关装置、设备和存储介质,其中,手写记录转换方法包括:基于目标手记图像进行字符识别,得到识别结果;基于识别结果,构造第一大模型指令;其中,第一大模型指令用于指示大语言模型执行如下操作:基于识别结果体现的上下文逻辑修正疑似识别错误的识别字符以得到错误修正之后的识别内容、基于识别结果分析目标手记图像中手写记录的版式结构,以及利用目标标记语言将识别内容处理为符合版式结构,以输出作为手写记录的目标识别记录;获取大语言模型响应第一大模型指令的输出内容,作为目标识别记录。上述方案,能够提升手写记录转换的准确性以及转换前后的视觉一致性。
技术关键词
大语言模型
字符识别
转换方法
指令
显式方式
坐标
多模态
样式
语义特征
图像识别模块
标记
逻辑
数据
关系
程序
处理器
字段
冗余
系统为您推荐了相关专利信息
自动驾驶运动规划
大语言模型
仿真环境
轨迹
运动规划系统
计费规则
管理方法
加权融合算法
计算机可读指令
数据
数据处理方法
计算机可读指令
脚本
语句
计算机设备