摘要
本公开的实施例提供一种特定中文文本合理性检测模型的构建方法和装置,该模型构建方法包括:根据两种不同粒度对已有的特定中文文本数据进行分词,构建先验知识词组库;基于先验知识词组库构建包含不同形式的目标函数的假设空间;通过最小化模型误差在假设空间中拟合出最优目标函数;以及基于最优目标函数构建中文文本合理性检测模型,以便基于中文文本合理性检测模型对生成的特定中文文本进行合理性检测。
技术关键词
中文文本
合理性检测方法
模型误差
分词
多项式核函数
模型构建方法
概率分布函数
数据
高斯核函数
正则化参数
处理器
可读存储介质
训练集
偏差
复杂度
存储器
计算机
系统为您推荐了相关专利信息
自动生成方法
模版
大语言模型
自然语言分词
项目
信息提取方法
词典
PageRank算法
文本
数据