壮文古籍文献音频化方法及系统

AITNT
正文
推荐专利
壮文古籍文献音频化方法及系统
申请号:CN202511121682
申请日期:2025-08-12
公开号:CN120977284A
公开日期:2025-11-18
类型:发明专利
摘要
本发明公开了一种壮文古籍文献音频化方法及系统,该方法通过五大核心模块实现自动化处理:首先,古籍图像处理模块对输入图像进行去噪、二值化、字符分割及质量优化;其次,古壮字映射词库构建模块建立字形与音标的对应关系;再者,光学字符识别模块采用CNN与LSTM结合的学习模型,输出标准文本及对应音标;随后,文本到语音模块针对壮语六音调特点优化语音合成模型;最后,系统集成模块实现从图像输入到音频输出的端到端自动化流程。本发明填补了古壮字数字化处理的技术空白,提高了古籍识别效率与语音合成自然度,便于壮族文化遗产的保存、传播及向视力障碍者等群体普及,同时具备扩展至其他少数民族古籍处理的潜力。
技术关键词
音频 图像处理模块 光学字符识别 深度神经网络 生成语音 文本 系统集成模块 注意力机制 滤波算法 动态更新 发音 印刷体 波形 关键词
系统为您推荐了相关专利信息
1
一种融合置信对应估计的深度神经网络图像变化检测方法
图像变化检测方法 不确定性特征 变化检测网络 深度神经网络 多级卷积神经网络
2
一种基于声音识别的多维度水电站控制盘柜工况异常监测方法
控制盘柜 异常监测方法 红外图像监控 水电站 置信度数值
3
语音识别方法、装置、设备、介质及产品
语音识别模型 音频 语音识别方法 数据 非语音
4
基于SAR图像的目标RCS智能预测方法、装置和存储介质
智能预测方法 回波 图像 积层 智能预测装置
5
一种基于非合作博弈的电动重卡换电调度方法
非合作博弈 重卡 换电站 训练深度神经网络 决策
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号