摘要
本发明涉及基于文本处理的模型训练技术领域,具体涉及一种人工智能模型的训练方法及系统。该方法根据先验样本集中每个沟通样本数据中沟通对象之间的语句组成差异和在时序上的发言关联的差异,得到语境尺度进行聚类得到样本聚类簇;依据先验样本集中沟通语句之间的结构组成分析近似情况聚类得到语句聚类簇,通过每个语句聚类簇在样本聚类簇中的分布情况,确定语句可读性;在训练样本集中获取沟通样本数据的语境尺度,结合每个沟通语句匹配得到的语句可读性,得到修正关注权重进行沟通语句训练得到人工智能模型。本发明结合先验样本集在沟通中的语境和语句分析,修正训练过程中每个沟通语句的关注程度,使训练过程更可靠得到模型更优。
技术关键词
语句
人工智能模型
对象
聚类
训练样本集
时序
模型训练技术
分析模块
数据获取模块
训练系统
指标
文本
信息熵
度量
字符
系统为您推荐了相关专利信息
板件组合
入库方法
打印图像数据
家具板件
电子标签
网络安全漏洞
大语言模型
指令
训练样本集
电子设备
穿戴检测方法
边缘检测算法
边缘轮廓
画面
对象检测
数据标注方法
大语言模型
数据标注系统
关键词
大规模文本数据