用于对有声读物大模型进行训练的方法及相关产品

正文

推荐专利

申请号：CN202411897189

申请日期：2024-12-20

公开号：CN119889274A

公开日期：2025-04-25

类型：发明专利

摘要

本披露公开了一种用于对有声读物大模型进行训练的方法及相关产品。该方法包括：获取第一音频，第一音频为单个人的人声干音和音乐元素的混合音频，音乐元素包括音效和/或背景音乐；对第一音频进行预处理，以获得第一音频的文本信息、第一描述信息、第一量化编码、第二描述信息和第二量化编码；根据思维链将文本信息、第一描述信息、第一量化编码、第二描述信息和第二量化编码进行组合，以获得模型提示词；将模型提示词输入至有声读物大模型中，以实现对有声读物大模型进行训练。利用训练完成的有声读物大模型可以获得人声富有情感、且带有音效和背景音乐的有声读物音频，内容更加生动有趣，提升了有声读物的质量及用户的听觉体验。

技术关键词

有声读物人声音乐音频解码器编码生成对抗网络元素文本音效风格语义特征自然语言框架程序处理器指令可读存储介质模块场景

系统为您推荐了相关专利信息

基于改进二进制模拟退火算法的网络入侵检测方法

模拟退火算法网络入侵检测方法网络入侵检测模型入侵检测数据 Boosting算法

一种动态更新的多源异构电力用户画像方法及系统

异构电力画像方法动态更新长短期记忆网络数据

一种基于持续优化Mamba网络的机床进给轴精度退化预测性维护方法

机床进给轴编码器全生命周期数据滑动窗口振动传感器

人工耳蜗刺激方法、装置、及助听设备

信噪比音频信号估计算法助听设备

数据处理电路、显示驱动芯片及显示装置

数据处理电路振荡模块显示驱动芯片编码模块 LED显示面板

用于对有声读物大模型进行训练的方法及相关产品

站点导航

APP 下载