用于经由自动多模态图构造的基于知识的音频-文本建模的系统和方法

正文

推荐专利

申请号：CN202510529539

申请日期：2025-04-25

公开号：CN120851152A

公开日期：2025-10-28

类型：发明专利

摘要

执行经由自动多模态图构造的基于知识的音频‑文本建模。接收音频数据集，所述音频数据集包括音频数据的片段，其中音频数据的片段中的每个与描述音频数据的相应片段的音频内容的对应元数据配对。从语义网络识别感兴趣的图节点，所述图节点描述音频数据集内容的知识领域的语义。将大语言模型(LLM)用于使元数据分类到图节点中，并用于为针对其不存在元数据的图节点推断补充数据，从而产生提取的知识图谱。利用LLM验证提取的知识图谱，以执行提取的知识图谱的图节点之间的边的关系验证，从而减轻补充数据的分类和推断中的幻觉效应。

技术关键词

音频图谱识别感兴趣节点多模态语义数据分类非暂时性计算机可读介质机器学习模型字幕文本网络效应定义关系语音标签人类

系统为您推荐了相关专利信息

一种人形机器人的情感分析处理方法、系统、设备及介质

语音特征数据多模态情感分类模型视觉特征融合特征

基于知识图谱的地域文化视觉元素动态重构方法及系统

动态重构方法元素指数基线语义向量

文件检查方法、电子设备、存储介质及芯片系统

文件检查方法计算机程序代码电子设备芯片系统代码缺陷

基于LSTM神经网络和知识图谱的文本关联分析方法及系统

LSTM神经网络关联分析方法语义关联分析系统文本主题词

一种基于半球型透明罩的元宇宙多模态微环境协同系统

安全控制模块协同系统多模态环境负载均衡算法多传感器融合

用于经由自动多模态图构造的基于知识的音频-文本建模的系统和方法

站点导航

APP 下载