摘要
本发明公开了一种基于轻量级BERT的中文电子书语音播报方法,包括以下步骤:(1)获取数据集并进行预处理;(2)构建微调教师模型的数据集,利用工具提取多音字的词性与读音作为训练目标;并进行预处理;(3)对训练目标中无关的读音进行掩码处理;(4)采用BERT模型作为学生模型,利用结构搜索优化器对BERT模型进行简化并进行训练;(5)构建多个教师模型,包括候选读音教师模型和词性教师模型;(6)提取各教师模型的输出,并通过学生模型在相同输入上训练,得到轻量级的中文读音预测学生模型;(7)将学生模型处理后的音素序列特征被输入到声学模型和声码器中,最终输出自然的语音播报;本发明显著提升了推理效率,具备较高的实际应用价值。
技术关键词
语音播报方法
电子书
教师
分类器
BERT模型
拼音
学生
编码向量
词性预测
模型超参数
标签
序列特征
多音字读音
搜索算法优化
文本
发音
词典
样本
系统为您推荐了相关专利信息
检测云台
回归树模型
检测检测方法
驾驶员面部特征
驾驶员人脸
脑电采集电极
脑电信号采集装置
识别方法
节点特征
特征提取模块
室内装饰施工
序列
自定义参数
矩阵
施工人员休息