摘要
本申请属于人工智能领域,涉及一种基于音频数据的酒驾检测方法,包括获取报案音频数据中的至少一个语音序列,并确定出目标音频数据;利用目标酒驾识别模型的语音识别模块提取出目标音频数据的语音特征向量;根据语音特征向量和预设的关键文本识别方法识别出目标音频数据的目标关键文本;利用目标酒驾识别模型的模态适配器将目标关键文本与语音特征向量进行对齐处理,得到多模态特征向量;利用目标酒驾识别模型的大语言模型对多模态特征向量进行分析,得到报案音频数据是否酒驾的标签。本申请还提供一种基于音频数据的酒驾检测装置、设备及介质。此外,本申请还涉及区块链技术,报案音频数据等可存储于区块链中。本申请能提高酒驾检测的准确度。
技术关键词
酒驾识别
音频
语音识别模块
文本识别方法
多模态
数据
语音特征
适配器
计算机设备
标签
序列识别
大语言模型
区块链技术
对齐模块
处理器通信
可读存储介质