摘要
本申请提供基于垂直场景及多模态的会议记录方法、系统、介质及装置,所述方法包括:获取多模态会议数据;多模态会议数据包括会议过程的语音数据、会议相关的非语音数据及垂直场景的专有名词;将多模态会议数据输入大语言模型,据以输出垂直场景的会议总结数据,包括:将会议过程的语音数据及会议相关的非语音数据分别转换成文本信息后输入大语言模型;或者,将会议过程的语音数据及会议相关的非语音数据直接输入训练好的多模态大语言模型。本申请充分考虑了会议多模态交互的特性,通过多模态信息充分挖掘利用垂直领域的数据,提高垂直场景会议信息记录的准确性,不再依赖于语音记录单一维度的信息,亦不再因缺乏垂直领域数据而造成模型效果受限。
技术关键词
会议记录方法
大语言模型
语音
数据
场景
生成会议记录
会议记录系统
对齐模块
检查点技术
文本
多模态交互
跨模态
注意力
多模态信息
解析工具
图片
计算机装置
异构
系统为您推荐了相关专利信息
机械臂夹爪
转移方法
视觉相机
集成支架
亚克力面板
数据处理中心
动态调节方法
机器学习模型
报告
采集设备
LSTM模型
放射性核素浓度
扩散预测方法
网络模块
训练集