摘要
本发明涉及自然语言生成技术领域,公开了一种多层次价值体系构建方法和系统,方法包括基于人工设定的价值锚定词构建价值体系的第一层;从真实世界的语料库中挖掘价值单元:基于词性标注词序列生成候选短语,并采用远监督集成训练技术训练短语质量评估器,以从候选短语中进行筛选,将筛选出的短语作为价值单元;在价值锚定词的引导下,对相似语义的价值单元进行聚类,形成价值体系的第三层;将基于聚类结果归纳出的概括性短语作为价值体系的第二层,从而构建多层次价值体系。本发明提出的方法自动化程度高,并且强调多技术路径融合与真实世界语料驱动,构建的价值体系覆盖广泛且内涵丰富。
技术关键词
多层次
集成训练
聚类
自然语言生成技术
序列
标签
样本
预测误差
语义
矩阵
计算机系统
关键词
存储器
训练集
处理器
定义
模块
索引
分层
变量