一种基于大语言模型的语音文件检索方法、装置、设备及存储介质

正文

推荐专利

申请号：CN202510221414

申请日期：2025-02-27

公开号：CN120030186A

公开日期：2025-05-23

类型：发明专利

摘要

本申请公开了一种基于大语言模型的语音文件检索方法、装置、设备及存储介质，涉及语音信息检索技术领域，包括：获取视频文件以及与视频文件对应的扩展文档，从视频文件中提取语音文件；利用目标语音识别模型对语音文件进行转录，得到已转录语言文本，并利用大语言模型与预设提示词机制对已转录语言文本进行处理，得到查询语句；利用查询语句对扩展文档进行检索，得到待处理文档，并利用大语言模型处理待处理文档，得到文档摘要；将文档摘要补偿至已转录语言文本中，得到目标语音文本，并基于目标语音文本生成语音信息索引，以利用语音信息索引检索目标语音文件。这样能够提高对语音文件进行转录的准确性，从而提升对语音文件进行检索的性能。

技术关键词

语音文件检索方法大语言模型语音识别模型文本语句生成语音索引摘要文件检索装置机制信息检索技术格式内存可读存储介质模块处理器电子设备存储器计算机

一种基于大语言模型的语音文件检索方法、装置、设备及存储介质

站点导航

APP 下载