摘要
本发明涉及人工智能、金融科技及数字医疗领域,公开了语义化音频处理方法、装置、计算机设备及存储介质,可应用于金融及医疗领域的音频处理。所述方法包括:接收用户输入的自然语言指令及原始音频;解析自然语言指令及原始音频,生成结构化处理指令;根据结构化处理指令动态匹配处理工具链,并将结构化处理指令转换为处理参数;根据处理工具链及处理参数处理原始音频,并生成目标音频。本发明通过将自然语言指令解析生成结构化处理指令,替代传统的专业术语输入,降低了交互门槛,提高了音频处理的易用性;通过将自然语言指令转换为处理参数,提高了对抽象需求的实现能力,利于金融及医疗领域的工作人员高效便捷完成音频处理工作。
技术关键词
自然语言
指令
语义
指纹比对技术
生成有向无环图
参数
计算机设备
音频特征
映射关系表
可读存储介质
多模态
动态
金融
处理器
模块
存储器
门槛