音频文件生成方法及装置

AITNT
正文
推荐专利
音频文件生成方法及装置
申请号:CN202510406393
申请日期:2025-04-01
公开号:CN120375799A
公开日期:2025-07-25
类型:发明专利
摘要
本发明实施例公开了一种音频文件生成方法及装置。本发明实施例会在接收到音频生成指令后,获取多模态参考信息,并调用与多模态参考信息匹配的至少一个目标大语言模型对多模态参考信息进行意图识别以确定目标音频生成需求,再根据目标音频生成需求确定对应的歌曲描述和曲谱描述,进而根据歌曲描述和曲谱描述生成目标音频文件。其中,所述目标音频生成需求用于表征对于音频文件的生成需求。由此,通过支持多模态参考信息输入,并根据多模态参考信息生成目标音频文件,本发明实施例可以确保所生成的音频文件能够满足用户需求,从而提升用户体验。
技术关键词
大语言模型 多模态 音频文件生成方法 意图识别 生成指令 歌词信息 人声 计算机程序指令 传感器组件 计算机程序产品 信号 生成歌词 存储计算机程序 图片 生成装置 处理器 可读存储介质 电子设备
系统为您推荐了相关专利信息
1
大语言模型的评估方法、装置和计算机设备
文本 大语言模型 网络资源数据 计算机设备 计算机程序产品
2
一种基于大模型的面向战略运筹分析事件数据集构建方法
大语言模型 分析事件 文本 数据集构建方法 模版
3
多场景营养运动集中智能分析方法及系统
智能分析方法 多模态信息融合 关联规则挖掘算法 个性化健康建议 多场景
4
基于PET-CT的非小细胞肺癌新辅助免疫治疗疗效多模态智能预测方法和模型
智能预测方法 肺癌 注意力机制 特征提取器 多模态信息融合
5
基于多模态数据融合的健康监测与疼痛评估系统及方法
多模态数据融合 疼痛评估系统 疼痛评估方法 健康监测数据 多尺度卷积神经网络
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号