用于长语音的语音大模型推理方法及装置

AITNT
正文
推荐专利
用于长语音的语音大模型推理方法及装置
申请号:CN202510356151
申请日期:2025-03-25
公开号:CN120260547A
公开日期:2025-07-04
类型:发明专利
摘要
本发明提出一种用于长语音的大模型推理方法和装置,包括:获取已标记训练标签的语音训练信号,通过信息提取模块对语音训练信号进行编码,得到语音训练信号的原语音表示,依据原语音表示的文本含量和帧间相似度,对原语音表示进行压缩合,得到压缩语音表示;将压缩语音表示输入大语言模型,执行推理任务,得到语音训练信号对应的推理结果,根据推理结果和训练标签构建损失函数训练信息提取模块;将长语音信号输入训练完成后的信息提取模块,得到长语音信号的压缩语音表示,并将其输入大语言模型,得到长语音信号对应的推理结果。本发明增强了长语音理解能力,在保证高生成质量的同时极大减小了推理代价和推理时间。
技术关键词
语音 推理方法 推理装置 大语言模型 信息显示设备 信号 模块 文本 标签 人工智能模型 标记 计算机程序产品 电子设备 编码 可读存储介质 处理器 代表 客户端 参数
系统为您推荐了相关专利信息
1
一种压疮智能监测预警装置
柔性压力垫 智能监测预警装置 中央处理器模块 传感器阵列 薄膜压力传感器
2
分布式光伏发电预测方法、装置及存储介质、控制器
分布式光伏发电 天气预报数据 大语言模型 预测装置 数据格式
3
一种生成式大语言模型的预训练方法和装置
文本 序列 大语言模型 元素 编码向量
4
一种民用爆炸物品生产安全隐患的识别方法及系统
民用爆炸物品 识别方法 安全隐患信息 报表 传感器
5
意向订单的查询交互方法、系统、电子设备和存储介质
查询交互方法 人工智能技术 查询交互系统 客户 订单
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号