摘要
本发明属于数据生成技术领域,公开一种虚拟人物训练数据生成方法及系统,该方法包括:对虚拟人物进行分析,构建虚拟人物的属性、表达方式及应用场景;基于虚拟人物的属性、表达方式及应用场景,对大语言模型进行训练,并评估训练后的生成效果;根据评估结果动态调整标注数据集中表达方式的比例,并基于调整后的比例更新大语言模型;根据目标虚拟人物的属性、表达方式及目标应用场景,利用更新后的大语言模型生成相应的对话内容数据,得到虚拟人物训练数据。本发明不仅支持复杂的虚拟人物设定,而且还具备强迁移性和高效制备多虚拟人物数据的优势。
技术关键词
训练数据生成方法
文本
大语言模型
场景
上下文特征
深度学习模型
训练数据生成系统
指标
主题模型
情感分析法
数据生成技术
分析工具
生成特征
情感分析模型
风格
互动特征
识别情感
词频统计
动态