摘要
本发明公开基于三幕结构思维链和语义自洽的事件驱动故事生成方法及系统,涉及自然语言处理领域。本发明在生成故事前,对示例进行优化。采用聚类算法从数据集中选取类型多样、能体现任务域的故事文本示例,让大规模语言模型能够学习到不同类型故事的写作方式;在生成故事时,将故事划分为开端、冲突和结局三个阶段,引入思维链提示技术的理念,构建三幕结构思维链模板;在生成故事后,提出一种语义自洽方法,先要求模型生成多个不同的故事文本,并利用聚类算法从中筛选出语义最为自洽的故事文本簇,之后,根据每个故事文本的连贯性和相关性评分,选定得分最高的者作为最终答案。本发明提出的方法在ROCStories数据集上达到了理想的结果。
技术关键词
故事生成方法
文本
预训练语言模型
语义向量
序列
依存句法分析
层次聚类算法
多语言
写作方式
提示技术
答案
模板
数据
自然语言
编码
元素
阶段
系统为您推荐了相关专利信息
医疗文本数据
多模块
医学知识库
大语言模型
逻辑
动态
网络特征
皮尔逊相关系数
情绪分析方法
面部特征点
报告生成系统
机器学习方法预测
自然语言生成技术
处理单元
数据整合技术
深度卷积神经网络模型
序列特征
浅层特征提取
深层特征提取
Softmax函数