摘要
基于多智能体协同机制的音频转译标注及分析的方法,属于信息技术和人工智能领域,要点是S1.将音频文件转译为文本文件;S2.将文本文件通过引入了领域知识与语言风格学习的模型,输出文本结构整理的对话集;S3.通过加入提示工程的大语言模型,抽取并结构化表达时间表达式、地点名称及摘要段落,并关联事件背景与会话上下文,得到信息集;S4.将对话集与信息集拼接得到文档集;S5.将一系列文本和其对应的具有包含关系的各级标签构成文本—标签对数据集,并将文本—标签对数据集构造为符合指令微调格式规范的指令数据集;S6.根据指令数据集对大语言模型基座微调得到微调后的模型;S7.将文档集输入微调后的模型标注各级标签,得到带有标签的文档集,用于从音频转录到文本优化、信息提取、标注和分析报告生成的全流程自动化处理。
技术关键词
多智能体协同
标签
线性变换矩阵
音频
文本
预训练语言模型
多头注意力机制
参数
摘要
序列
分词
词嵌入向量
前馈神经网络
表达式
数据
指令
关系
系统为您推荐了相关专利信息
手语翻译方法
语义
层级
视觉特征
交叉注意力机制