摘要
本申请公开了一种基于大语言模型的语音文件检索方法、装置、设备及存储介质,涉及语音信息检索技术领域,包括:获取视频文件以及与视频文件对应的扩展文档,从视频文件中提取语音文件;利用目标语音识别模型对语音文件进行转录,得到已转录语言文本,并利用大语言模型与预设提示词机制对已转录语言文本进行处理,得到查询语句;利用查询语句对扩展文档进行检索,得到待处理文档,并利用大语言模型处理待处理文档,得到文档摘要;将文档摘要补偿至已转录语言文本中,得到目标语音文本,并基于目标语音文本生成语音信息索引,以利用语音信息索引检索目标语音文件。这样能够提高对语音文件进行转录的准确性,从而提升对语音文件进行检索的性能。
技术关键词
语音文件检索方法
大语言模型
语音识别模型
文本
语句
生成语音
索引
摘要
文件检索装置
机制
信息检索技术
格式
内存
可读存储介质
模块
处理器
电子设备
存储器
计算机