摘要
本发明公开了一种壮文古籍文献音频化方法及系统,该方法通过五大核心模块实现自动化处理:首先,古籍图像处理模块对输入图像进行去噪、二值化、字符分割及质量优化;其次,古壮字映射词库构建模块建立字形与音标的对应关系;再者,光学字符识别模块采用CNN与LSTM结合的学习模型,输出标准文本及对应音标;随后,文本到语音模块针对壮语六音调特点优化语音合成模型;最后,系统集成模块实现从图像输入到音频输出的端到端自动化流程。本发明填补了古壮字数字化处理的技术空白,提高了古籍识别效率与语音合成自然度,便于壮族文化遗产的保存、传播及向视力障碍者等群体普及,同时具备扩展至其他少数民族古籍处理的潜力。
技术关键词
音频
图像处理模块
光学字符识别
深度神经网络
生成语音
文本
系统集成模块
注意力机制
滤波算法
动态更新
发音
印刷体
波形
关键词
系统为您推荐了相关专利信息
图像变化检测方法
不确定性特征
变化检测网络
深度神经网络
多级卷积神经网络
控制盘柜
异常监测方法
红外图像监控
水电站
置信度数值