摘要
本发明涉及基于大语言模型语义能力的说话人日志任务优化方法,属于人工智能技术领域。本发明包括步骤:通过语音活动检测和自动语音识别模块生成带时间戳的语音转录文本,将生成的时间戳与转录文本整合,形成时间戳文本流;利用提示构造器分析时间戳文本流,生成与说话人日志任务匹配的提示词;将生成的提示词、时间戳文本流输入大语言模型,解析时间戳和文本内容,生成包含时间戳、句子和说话人标签的初步说话人日志结果;对初步说话人日志结果进行后处理,输出准确的说话人日志结果,本发明的错误率有明显降低。
技术关键词
大语言模型
语音活动检测
日志
自动语音识别
文本
说话人身份
非暂态计算机可读存储介质
语义特征
带时间
处理器
多轮对话
人工智能技术
模块
计算机程序产品
标签
错误率
存储器
标记
系统为您推荐了相关专利信息
综合评估模型
关键词特征
价值综合评估
时间序列模型
文本
信息生成方法
多模态数据融合
信息熵
统一社会信用代码
大数据
多模态
跨模态融合特征
图像解码器
缺陷分析
联合损失函数