摘要
本公开提供了一种音频转写方法和装置,涉及人工智能技术领域,具体为自然语言处理和深度学习技术领域。该方法的一具体实施方式包括:接收通过客户端安装的存储服务应用的场景入口上传的音频信息;基于场景入口,确定音频信息的场景类型;对音频信息进行语音识别,得到音频信息对应的文本信息;将文本信息和场景类型对应的提示信息输入至语言模型,得到总结信息,其中,语言模型是利用各种场景类型对应的样本对预训练模型进行有监督微调得到的,各种场景类型对应的提示信息是利用语言模型对各种场景类型对应的初始提示信息进行调优得到的。该实施方式的语言模型的输出效果更加符合各种场景类型下用户的需求。
技术关键词
场景
文本
音频
样本
客户端
转写方法
入口
语言模型训练方法
预训练模型
大语言模型
指令
转写装置
模型训练装置
语音识别模块
深度学习技术
处理器
人工智能技术
计算机程序产品
系统为您推荐了相关专利信息
加油站监测系统
场景分类
标识符
管理方法
终端设备
功率变换设备
控制栅极电压
开关管
驱动芯片
控制器
识别二维码图像
像素
二维码识别系统
加权最小二乘法
保留图像细节