音频文件生成方法及装置

正文

推荐专利

音频文件生成方法及装置

申请号：CN202510406393

申请日期：2025-04-01

公开号：CN120375799A

公开日期：2025-07-25

类型：发明专利

摘要

本发明实施例公开了一种音频文件生成方法及装置。本发明实施例会在接收到音频生成指令后，获取多模态参考信息，并调用与多模态参考信息匹配的至少一个目标大语言模型对多模态参考信息进行意图识别以确定目标音频生成需求，再根据目标音频生成需求确定对应的歌曲描述和曲谱描述，进而根据歌曲描述和曲谱描述生成目标音频文件。其中，所述目标音频生成需求用于表征对于音频文件的生成需求。由此，通过支持多模态参考信息输入，并根据多模态参考信息生成目标音频文件，本发明实施例可以确保所生成的音频文件能够满足用户需求，从而提升用户体验。

技术关键词

大语言模型多模态音频文件生成方法意图识别生成指令歌词信息人声计算机程序指令传感器组件计算机程序产品信号生成歌词存储计算机程序图片生成装置处理器可读存储介质电子设备

系统为您推荐了相关专利信息

大语言模型的评估方法、装置和计算机设备

文本大语言模型网络资源数据计算机设备计算机程序产品

一种基于大模型的面向战略运筹分析事件数据集构建方法

大语言模型分析事件文本数据集构建方法模版

多场景营养运动集中智能分析方法及系统

智能分析方法多模态信息融合关联规则挖掘算法个性化健康建议多场景

基于PET-CT的非小细胞肺癌新辅助免疫治疗疗效多模态智能预测方法和模型

智能预测方法肺癌注意力机制特征提取器多模态信息融合

基于多模态数据融合的健康监测与疼痛评估系统及方法

多模态数据融合疼痛评估系统疼痛评估方法健康监测数据多尺度卷积神经网络

音频文件生成方法及装置

站点导航

APP 下载