摘要
本公开提供了一种问答语料生成方法、装置及相关设备,应用于自然语言处理技术领域。该方法包括:获取目标文档,目标文档包括多个层级标题和每个层级标题对应的文本内容;根据多个层级标题和每个层级标题对应的文本内容对目标文档进行文本分块,得到多个文本块;基于每个文本块的层级标题级别和每个文本块的文本内容,确定每个文本块的问题分配策略;基于问题分配策略和提示词模板,从每个文本块中提取问题列表;利用大语言模型回答问题列表中的问题,生成问答语料。本实施例可以提升问答语料在覆盖度和准确性上的质量,同时提高问答语料的生成效率。
技术关键词
问答语料生成方法
文本
大语言模型
层级
摘要
分块
策略
列表
树状结构
生成提示词
模板
切片
处理器
计算机程序产品
生成装置
自然语言
指令
模块
动态
系统为您推荐了相关专利信息
图像识别模型
网页元素
定位方法
机器学习算法
定位系统
特征提取模型
中医药
注意力机制
时序特征
视觉特征提取
训练数据生成方法
答案
计算机程序产品
关键词
编码向量