音频转写方法和装置

正文

推荐专利

音频转写方法和装置

申请号：CN202410813620

申请日期：2024-06-21

公开号：CN118645106A

公开日期：2024-09-13

类型：发明专利

摘要

本公开提供了一种音频转写方法和装置，涉及人工智能技术领域，具体为自然语言处理和深度学习技术领域。该方法的一具体实施方式包括：接收通过客户端安装的存储服务应用的场景入口上传的音频信息；基于场景入口，确定音频信息的场景类型；对音频信息进行语音识别，得到音频信息对应的文本信息；将文本信息和场景类型对应的提示信息输入至语言模型，得到总结信息，其中，语言模型是利用各种场景类型对应的样本对预训练模型进行有监督微调得到的，各种场景类型对应的提示信息是利用语言模型对各种场景类型对应的初始提示信息进行调优得到的。该实施方式的语言模型的输出效果更加符合各种场景类型下用户的需求。

技术关键词

场景文本音频样本客户端转写方法入口语言模型训练方法预训练模型大语言模型指令转写装置模型训练装置语音识别模块深度学习技术处理器人工智能技术计算机程序产品

系统为您推荐了相关专利信息

一种基于虚幻引擎UE4制作3D可视化地图的方法

内容浏览器世界地图制作管理文件夹项目

基于安全校验的密匙管理方法及系统

加油站监测系统场景分类标识符管理方法终端设备

功率变换设备及其控制方法、开关驱动芯片

功率变换设备控制栅极电压开关管驱动芯片控制器

一种透视变换电路、方法、芯片及设备

缓存数据控制变换电路坐标命令像素

一种针对二维码识别的预处理方法和装置

识别二维码图像像素二维码识别系统加权最小二乘法保留图像细节

音频转写方法和装置

站点导航

APP 下载