摘要
本发明公开了一种基于实体解析的高效多轮数据生成方法及存储介质,包括:实体识别、实体前后缀修饰提取、通用句式前缀提取、实体数量判断、语义绑定识别、数据拆分、以及数据呈现;本发明能够极大地丰富多轮训练数据的来源,无需依赖大量人工收集与标注,也避免了高成本的模型生成方式;显著提升了多轮数据的获取效率,能够快速为模型训练提供充足的数据。同时,由于基于单轮数据的转化逻辑严谨,保证了生成的多轮数据在语义和逻辑上的准确性,有助于提升模型在多轮交互任务中的性能表现,进而增强人工智能系统在多轮交互应用场景中的实用性和用户体验。
技术关键词
数据生成方法
单轮
命名实体识别模型
语义分析技术
人工智能系统
文本
意图
生成方式
分词
处理器
逻辑
程序
存储器
场景
频率
基础
关系