壮文古籍文献音频化方法及系统

正文

推荐专利

壮文古籍文献音频化方法及系统

申请号：CN202511121682

申请日期：2025-08-12

公开号：CN120977284A

公开日期：2025-11-18

类型：发明专利

摘要

本发明公开了一种壮文古籍文献音频化方法及系统，该方法通过五大核心模块实现自动化处理：首先，古籍图像处理模块对输入图像进行去噪、二值化、字符分割及质量优化；其次，古壮字映射词库构建模块建立字形与音标的对应关系；再者，光学字符识别模块采用CNN与LSTM结合的学习模型，输出标准文本及对应音标；随后，文本到语音模块针对壮语六音调特点优化语音合成模型；最后，系统集成模块实现从图像输入到音频输出的端到端自动化流程。本发明填补了古壮字数字化处理的技术空白，提高了古籍识别效率与语音合成自然度，便于壮族文化遗产的保存、传播及向视力障碍者等群体普及，同时具备扩展至其他少数民族古籍处理的潜力。

技术关键词

音频图像处理模块光学字符识别深度神经网络生成语音文本系统集成模块注意力机制滤波算法动态更新发音印刷体波形关键词

系统为您推荐了相关专利信息

一种融合置信对应估计的深度神经网络图像变化检测方法

图像变化检测方法不确定性特征变化检测网络深度神经网络多级卷积神经网络

一种基于声音识别的多维度水电站控制盘柜工况异常监测方法

控制盘柜异常监测方法红外图像监控水电站置信度数值

语音识别方法、装置、设备、介质及产品

语音识别模型音频语音识别方法数据非语音

基于SAR图像的目标RCS智能预测方法、装置和存储介质

智能预测方法回波图像积层智能预测装置

一种基于非合作博弈的电动重卡换电调度方法

非合作博弈重卡换电站训练深度神经网络决策

壮文古籍文献音频化方法及系统

站点导航

APP 下载