一种基于大语言模型的语音文件检索方法、装置、设备及存储介质

AITNT
正文
推荐专利
一种基于大语言模型的语音文件检索方法、装置、设备及存储介质
申请号:CN202510221414
申请日期:2025-02-27
公开号:CN120030186A
公开日期:2025-05-23
类型:发明专利
摘要
本申请公开了一种基于大语言模型的语音文件检索方法、装置、设备及存储介质,涉及语音信息检索技术领域,包括:获取视频文件以及与视频文件对应的扩展文档,从视频文件中提取语音文件;利用目标语音识别模型对语音文件进行转录,得到已转录语言文本,并利用大语言模型与预设提示词机制对已转录语言文本进行处理,得到查询语句;利用查询语句对扩展文档进行检索,得到待处理文档,并利用大语言模型处理待处理文档,得到文档摘要;将文档摘要补偿至已转录语言文本中,得到目标语音文本,并基于目标语音文本生成语音信息索引,以利用语音信息索引检索目标语音文件。这样能够提高对语音文件进行转录的准确性,从而提升对语音文件进行检索的性能。
技术关键词
语音文件检索方法 大语言模型 语音识别模型 文本 语句 生成语音 索引 摘要 文件检索装置 机制 信息检索技术 格式 内存 可读存储介质 模块 处理器 电子设备 存储器 计算机
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号