音频转写方法和装置

AITNT
正文
推荐专利
音频转写方法和装置
申请号:CN202410813620
申请日期:2024-06-21
公开号:CN118645106A
公开日期:2024-09-13
类型:发明专利
摘要
本公开提供了一种音频转写方法和装置,涉及人工智能技术领域,具体为自然语言处理和深度学习技术领域。该方法的一具体实施方式包括:接收通过客户端安装的存储服务应用的场景入口上传的音频信息;基于场景入口,确定音频信息的场景类型;对音频信息进行语音识别,得到音频信息对应的文本信息;将文本信息和场景类型对应的提示信息输入至语言模型,得到总结信息,其中,语言模型是利用各种场景类型对应的样本对预训练模型进行有监督微调得到的,各种场景类型对应的提示信息是利用语言模型对各种场景类型对应的初始提示信息进行调优得到的。该实施方式的语言模型的输出效果更加符合各种场景类型下用户的需求。
技术关键词
场景 文本 音频 样本 客户端 转写方法 入口 语言模型训练方法 预训练模型 大语言模型 指令 转写装置 模型训练装置 语音识别模块 深度学习技术 处理器 人工智能技术 计算机程序产品
系统为您推荐了相关专利信息
1
一种基于虚幻引擎UE4制作3D可视化地图的方法
内容浏览器 世界地图 制作管理 文件夹 项目
2
基于安全校验的密匙管理方法及系统
加油站监测系统 场景分类 标识符 管理方法 终端设备
3
功率变换设备及其控制方法、开关驱动芯片
功率变换设备 控制栅极电压 开关管 驱动芯片 控制器
4
一种透视变换电路、方法、芯片及设备
缓存数据控制 变换电路 坐标 命令 像素
5
一种针对二维码识别的预处理方法和装置
识别二维码图像 像素 二维码识别系统 加权最小二乘法 保留图像细节
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号