摘要
本公开提供了一种基于大模型处理音频文件的方法、装置、设备及存储介质,涉及语音技术与自然语言处理等人工智能技术领域。具体实现方案为:在基于大模型的交互界面中,获取输入的音频文件;基于所述大模型,对所述音频文件进行识别,获取并在所述交互界面中展示识别信息;基于所述大模型,对所述识别信息进行分析,得到并在所述交互界面中展示分析结果。本公开的技术,能够有效地丰富AI产品的功能;而且也能够提高AI产品处理音频文件的准确性和有效性;还能够有效地降低用户在基于大模型交互过程中的操作复杂度,进一步有效地提升了用户体验。
技术关键词
音频播放器
界面
主题
文本
语音技术
人工智能技术
计算机程序产品
处理器通信
自然语言
指令
对象
可读存储介质
存储器
有效性
复杂度
电子设备
模块