摘要
本申请公开了一种有声书配乐生成方法、设备、介质及计算机程序产品,涉及音乐生成技术领域,包括:获取待配乐有声书的目标文本段的文本特征以及段落时间戳信息;对文本特征进行情感分析,并基于文本特征、解析得到的段落情感信息和段落时间戳信息进行音乐生成,得到目标文本段对应的目标音乐符号片段;将目标音乐符号片段与待配乐有声书的其他文本段对应的其他音乐符号片段进行拼接,得到符号音乐;基于符号音乐生成目标有声书配乐。由此,可结合目标文本段的段落情感信息和文本段落时间戳信息,生成质量可控性更强的符号音乐,并生成最终的有声书配乐,这样可保证配乐生成的情感可控,借助符号音乐消除听感不连贯问题,提高了配乐生成质量。
技术关键词
配乐生成方法
文本段落
音频
符号
计算机程序产品
音乐生成技术
语音
三元组损失函数
跨模态学习
多层感知机
变量
频段
处理器
可读存储介质
多模态
人声
参数
电子设备
系统为您推荐了相关专利信息
动态面部表情
辅助诊断方法
视觉特征提取
多模态
文本
算法服务器
均衡服务器
任务调度方法
列表
任务调度装置
短信发送方法
LightGBM模型
信令
短信发送装置
身份证
光纤通信方法
正交幅度调制
空芯光纤
搜索算法
映射算法