用于长语音的语音大模型推理方法及装置

正文

推荐专利

用于长语音的语音大模型推理方法及装置

申请号：CN202510356151

申请日期：2025-03-25

公开号：CN120260547A

公开日期：2025-07-04

类型：发明专利

摘要

本发明提出一种用于长语音的大模型推理方法和装置，包括：获取已标记训练标签的语音训练信号，通过信息提取模块对语音训练信号进行编码，得到语音训练信号的原语音表示，依据原语音表示的文本含量和帧间相似度，对原语音表示进行压缩合，得到压缩语音表示；将压缩语音表示输入大语言模型，执行推理任务，得到语音训练信号对应的推理结果，根据推理结果和训练标签构建损失函数训练信息提取模块；将长语音信号输入训练完成后的信息提取模块，得到长语音信号的压缩语音表示，并将其输入大语言模型，得到长语音信号对应的推理结果。本发明增强了长语音理解能力，在保证高生成质量的同时极大减小了推理代价和推理时间。

技术关键词

语音推理方法推理装置大语言模型信息显示设备信号模块文本标签人工智能模型标记计算机程序产品电子设备编码可读存储介质处理器代表客户端参数

系统为您推荐了相关专利信息

一种压疮智能监测预警装置

柔性压力垫智能监测预警装置中央处理器模块传感器阵列薄膜压力传感器

分布式光伏发电预测方法、装置及存储介质、控制器

分布式光伏发电天气预报数据大语言模型预测装置数据格式

一种生成式大语言模型的预训练方法和装置

文本序列大语言模型元素编码向量

一种民用爆炸物品生产安全隐患的识别方法及系统

民用爆炸物品识别方法安全隐患信息报表传感器

意向订单的查询交互方法、系统、电子设备和存储介质

查询交互方法人工智能技术查询交互系统客户订单

用于长语音的语音大模型推理方法及装置

站点导航

APP 下载