摘要
本发明提出一种场景化自适应的语义识别方法、系统、设备和存储介质,通过在预训练语言模型上的微调再训练,可以让模型在一个较好的语义表征基座上进一步提高;通过对比学习的方法,可以让模型更好的表征整句话的语义;通过自适应的关键词抽取、正样本生成可以让模型在训练过程中获得更好的区分调校;通过prompt调用大模型能力用于数据校验和自动化标记,将数据准备和训练阶段进行剥离,实现小模型对大模型知识的学习。最终实现低成本、自适应、自监督的训练高质量语义表征模型。利用训练好的语义表征模型识别语义。
技术关键词
语义识别方法
文本
场景化数据
标签
训练集
语义识别系统
模板
训练语言模型
无监督
三元组
模型训练模块
参数
处理器
指标
标记
识别模块
可读存储介质
系统为您推荐了相关专利信息
数据生成模型
复合材料结构
健康监测数据
指数
标签
实体链接方法
大语言模型
图谱
文本
实体链接装置