摘要
本发明公开了一种应用于音频数据的多模态实体关系抽取方法,包括:构建音频实体关系数据集;通过音频实体关系数据集进行大模型训练,获得优化后的大模型,包括:对音频实体关系数据集进行Whisper模型转换处理,获得对应的文本数据,结合连接模块对文本数据进行优化,获得优化后的文本数据,基于优化后的文本数据,利用GPT‑3模型进行实体关系抽取以及文本预测,分别生成实体关系三元组以及文本预测的概率分布;将待处理的音频数据输入优化后的大模型,获得对应的实体关系抽取结果。该方法实现了对音频数据的高效、准确实体关系抽取,提升了从非结构化数据中获取有价值信息的能力,为智能交互等领域的智能化升级提供了有力支持。
技术关键词
实体关系抽取方法
实体关系数据
注意力
前馈神经网络
文本特征向量
三元组
音频特征
音频数据处理
多层感知机
特征提取模块
生成音频数据
生成提示词
命名实体识别
系统为您推荐了相关专利信息
航拍
卷积模块
高效多尺度
混合编码器
上下文语义信息
监测数据处理方法
大坝
监测数据处理系统
复数指数函数
网络
航位推算方法
前馈神经网络
惯性传感器数据
轮式移动机器人
注意力