摘要
本申请公开了一种PDF文档生成方法及装置。其中,该方法包括:获取待生成PDF文档的目标文本及指定字体;针对目标文本中每个字符,确定其编码信息,并从指定字体的第一编码库检索以判断该字符为生僻字或非生僻字;若识别出生僻字,则确定包含这些生僻字编码信息的第二编码库,当存在单一第二编码库时,选用此编码库对应的字体作为生僻字的显示字体,若存在多个第二编码库,应用预训练的字体识别模型分析生僻字的上下文信息及其对应字体,确定最佳显示字体;采用指定字体显示所有非生僻字,并使用所确定的显示字体显示各个生僻字,完成目标文本对应的PDF文档生成。本申请解决了PDF文档生成场景中生僻字显示不准确或缺失的技术问题。
技术关键词
字体
编码
字符
文本
文档生成方法
循环神经网络模型
文档生成装置
深度残差网络
长短期记忆网络
关系
对象
生成场景
计算机程序产品
处理器
分析模块
存储器
标签
样本
电子设备
系统为您推荐了相关专利信息
图像分割技术
语义分割模型
图像嵌入
后续图像处理
轮廓
成票方法
文本
大语言模型
计算机可执行指令
电力系统
异构系统数据
数据集成方法
综合语义
语义图谱
传输层特征