一种基于轻量级BERT的中文电子书语音播报方法

AITNT
正文
推荐专利
一种基于轻量级BERT的中文电子书语音播报方法
申请号:CN202510115309
申请日期:2025-01-24
公开号:CN120089125A
公开日期:2025-06-03
类型:发明专利
摘要
本发明公开了一种基于轻量级BERT的中文电子书语音播报方法,包括以下步骤:(1)获取数据集并进行预处理;(2)构建微调教师模型的数据集,利用工具提取多音字的词性与读音作为训练目标;并进行预处理;(3)对训练目标中无关的读音进行掩码处理;(4)采用BERT模型作为学生模型,利用结构搜索优化器对BERT模型进行简化并进行训练;(5)构建多个教师模型,包括候选读音教师模型和词性教师模型;(6)提取各教师模型的输出,并通过学生模型在相同输入上训练,得到轻量级的中文读音预测学生模型;(7)将学生模型处理后的音素序列特征被输入到声学模型和声码器中,最终输出自然的语音播报;本发明显著提升了推理效率,具备较高的实际应用价值。
技术关键词
语音播报方法 电子书 教师 分类器 BERT模型 拼音 学生 编码向量 词性预测 模型超参数 标签 序列特征 多音字读音 搜索算法优化 文本 发音 词典 样本
系统为您推荐了相关专利信息
1
基于树莓派的疲劳驾驶人脸追踪检测云台系统及检测方法
检测云台 回归树模型 检测检测方法 驾驶员面部特征 驾驶员人脸
2
阅读脚手架构建方法、装置、电子设备和存储介质
脚手架 文章 大语言模型 计算机程序产品 处理器
3
一种心理类型疾病诊断识别方法、装置及设备
脑电采集电极 脑电信号采集装置 识别方法 节点特征 特征提取模块
4
一种面向施工场景域间差异的持续测试时适应方法及系统
图像 标签 数据 因子 教师
5
一种基于AI的室内装饰施工优化方法及系统
室内装饰施工 序列 自定义参数 矩阵 施工人员休息
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号