用于对有声读物大模型进行训练的方法及相关产品

AITNT
正文
推荐专利
用于对有声读物大模型进行训练的方法及相关产品
申请号:CN202411897189
申请日期:2024-12-20
公开号:CN119889274A
公开日期:2025-04-25
类型:发明专利
摘要
本披露公开了一种用于对有声读物大模型进行训练的方法及相关产品。该方法包括:获取第一音频,第一音频为单个人的人声干音和音乐元素的混合音频,音乐元素包括音效和/或背景音乐;对第一音频进行预处理,以获得第一音频的文本信息、第一描述信息、第一量化编码、第二描述信息和第二量化编码;根据思维链将文本信息、第一描述信息、第一量化编码、第二描述信息和第二量化编码进行组合,以获得模型提示词;将模型提示词输入至有声读物大模型中,以实现对有声读物大模型进行训练。利用训练完成的有声读物大模型可以获得人声富有情感、且带有音效和背景音乐的有声读物音频,内容更加生动有趣,提升了有声读物的质量及用户的听觉体验。
技术关键词
有声读物 人声 音乐 音频解码器 编码 生成对抗网络 元素 文本 音效 风格 语义特征 自然语言 框架 程序 处理器 指令 可读存储介质 模块 场景
系统为您推荐了相关专利信息
1
面向自然果园非结构化场景的点云语义分割方法
非结构化场景 语义分割方法 三维点云数据 富士苹果树 邻域特征
2
基于深度学习的笔记本电池续航预测方法
笔记本电池 序列 笔记本电脑 ReLU函数 时序
3
音频理解模型的训练方法、音频理解方法、装置、存储介质和程序产品
音频 语音识别模型 模型主体 编码模块 声学特征
4
一种基于时空智能体的空气污染浓度预测方法及系统
浓度预测方法 消息传递网络 多任务损失函数 空气质量监测站 空气质量预测技术
5
一种基于深度学习的VLSI电路布局优化方法及系统
电路布局 矩阵 分区 Softmax函数 VLSI电路
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号