用于对有声读物大模型进行训练的方法及相关产品

AITNT
正文
推荐专利
用于对有声读物大模型进行训练的方法及相关产品
申请号:CN202411897189
申请日期:2024-12-20
公开号:CN119889274A
公开日期:2025-04-25
类型:发明专利
摘要
本披露公开了一种用于对有声读物大模型进行训练的方法及相关产品。该方法包括:获取第一音频,第一音频为单个人的人声干音和音乐元素的混合音频,音乐元素包括音效和/或背景音乐;对第一音频进行预处理,以获得第一音频的文本信息、第一描述信息、第一量化编码、第二描述信息和第二量化编码;根据思维链将文本信息、第一描述信息、第一量化编码、第二描述信息和第二量化编码进行组合,以获得模型提示词;将模型提示词输入至有声读物大模型中,以实现对有声读物大模型进行训练。利用训练完成的有声读物大模型可以获得人声富有情感、且带有音效和背景音乐的有声读物音频,内容更加生动有趣,提升了有声读物的质量及用户的听觉体验。
技术关键词
有声读物 人声 音乐 音频解码器 编码 生成对抗网络 元素 文本 音效 风格 语义特征 自然语言 框架 程序 处理器 指令 可读存储介质 模块 场景
系统为您推荐了相关专利信息
1
基于改进二进制模拟退火算法的网络入侵检测方法
模拟退火算法 网络入侵检测方法 网络入侵检测模型 入侵检测数据 Boosting算法
2
一种动态更新的多源异构电力用户画像方法及系统
异构电力 画像方法 动态更新 长短期记忆网络 数据
3
一种基于持续优化Mamba网络的机床进给轴精度退化预测性维护方法
机床进给轴 编码器 全生命周期数据 滑动窗口 振动传感器
4
人工耳蜗刺激方法、装置、及助听设备
信噪比 音频 信号 估计算法 助听设备
5
数据处理电路、显示驱动芯片及显示装置
数据处理电路 振荡模块 显示驱动芯片 编码模块 LED显示面板
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号