摘要
本发明提出一种用于长语音的大模型推理方法和装置,包括:获取已标记训练标签的语音训练信号,通过信息提取模块对语音训练信号进行编码,得到语音训练信号的原语音表示,依据原语音表示的文本含量和帧间相似度,对原语音表示进行压缩合,得到压缩语音表示;将压缩语音表示输入大语言模型,执行推理任务,得到语音训练信号对应的推理结果,根据推理结果和训练标签构建损失函数训练信息提取模块;将长语音信号输入训练完成后的信息提取模块,得到长语音信号的压缩语音表示,并将其输入大语言模型,得到长语音信号对应的推理结果。本发明增强了长语音理解能力,在保证高生成质量的同时极大减小了推理代价和推理时间。
技术关键词
语音
推理方法
推理装置
大语言模型
信息显示设备
信号
模块
文本
标签
人工智能模型
标记
计算机程序产品
电子设备
编码
可读存储介质
处理器
代表
客户端
参数
系统为您推荐了相关专利信息
柔性压力垫
智能监测预警装置
中央处理器模块
传感器阵列
薄膜压力传感器
分布式光伏发电
天气预报数据
大语言模型
预测装置
数据格式
民用爆炸物品
识别方法
安全隐患信息
报表
传感器
查询交互方法
人工智能技术
查询交互系统
客户
订单