基于大模型的音频数据语义内容匿名化方法、装置和设备

正文

推荐专利

申请号：CN202510763693

申请日期：2025-06-09

公开号：CN120910301A

公开日期：2025-11-07

类型：发明专利

摘要

本发明提供一种基于大模型的音频数据语义内容匿名化方法、装置和设备，属于数据处理领域。方法包括：获取目标音频；对目标音频进行对齐处理，得到目标音频对应的目标文本和目标文本中每个字符的时间戳信息；获取多个实体类别标签，多个实体类别标签中每个实体类别标签对应一个待匿名化处理的实体类别；分别获取多个实体类别标签的提示词模板，提示词模板用于指导预设模型的输出内容；将目标文本和多个提示词模板输入预设模型，得到预设模型输出的实体识别序列，实体识别序列用于指示目标文本中包括的待匿名化处理的实体；根据时间戳信息和实体识别序列对目标音频进行匿名化处理。可以提高对音频中隐私内容的识别准确度和模型的泛化能力。

技术关键词

实体音频标签模板序列匿名化方法文本非暂态计算机可读存储介质大语言模型语义损失函数优化矩阵预训练模型数据字符处理器自然语言处理单元存储器基座

系统为您推荐了相关专利信息

一种基于STL分解与多模型融合的潮流发电量预测方法

发电量预测方法历史运行数据斯皮尔曼相关系数历史气象数据序列

项目评分方法、评分装置、电子设备及存储介质

语义分析模型项目校准评分装置评分方法

一种数据处理方法和电子设备

视觉特征提取数据处理方法图像类别图像分类模型图像块

一种设备舒适度测量故障识别方法、系统及设备

故障识别方法舒适度信号故障识别系统变分模态分解算法

一种转录因子和转录因子靶点的预测方法及系统

转录因子结点异质注意力嵌入特征

基于大模型的音频数据语义内容匿名化方法、装置和设备

站点导航

APP 下载