摘要
本发明公开一种基于大模型的司法领域语义摘要方法、系统、设备及存储介质,方法包括:对庭审视频进行语音识别,将语音转换成庭审文本,标注庭审文本,得到标注文本集作为训练集;利用标注文本集训练大模型,在每一轮训练后,对大模型进行微调;对实际庭审视频进行语音识别,将语音转换成实际庭审文本,并提取时间戳;利用训练好的大模型识别实际庭审文本的庭审流程,推理庭审流程文本;利用匹配算法使得推理的庭审流程文本匹配到时间戳,庭审流程文本中每个流程开始位置的时间戳对应庭审视频的该流程的锚点,生成视频锚点;对推理的庭审流程文本进行摘要;将摘要文本与视频锚点结合,生成结构化的庭审信息。本发明提高了庭审视频处理的效率。
技术关键词
文本
摘要方法
视频
模糊匹配算法
语义
锚点
训练集
摘要系统
语音识别模块
样本
匹配模块
处理器
可读存储介质
存储器
计算机
电子设备
系统为您推荐了相关专利信息
数据分析系统
单光子探测器
同步控制模块
数据同步接口
数据分析方法
生成对抗网络模型
人工智能识别
对抗性
光学字符识别
测试方法
实时监测方法
波动特征
非接触式
RGB摄像头
血压