摘要
本发明公开了一种商户实体名称的提取方法及装置,该方法包括:获取彩铃录音数据,并将所述彩铃录音数据转换为文本内容集合;对所述文本内容集合进行分词处理和去停用词处理,得到关键词集合,并对所述关键词集合进行标注,得到标注语料库;基于所述标注语料库对预训练中文大模型进行训练,得到商户名称提取模型;将待处理文本输入所述商户名称提取模型,提取商户名称实体,得到商户名称提取结果集;对所述商户名称提取结果集进行验证,获取优化反馈信息;根据所述优化反馈信息,调整所述商户名称提取模型的参数,输出优化后的商户名称提取模型,用于提取商户实体名称。本发明提高了提取的准确率和自动化程度。
技术关键词
实体
文本
关键词
序列
语义分析模型
平衡度
彩铃
分词
语义特征
参数
训练集
指标
模型训练模块
样本
划分算法
生成标签
数据获取模块
数据处理模块
系统为您推荐了相关专利信息
分段
非线性最小二乘法
烤箱
参数估计算法
传感器节点
联合预测方法
空间拓扑结构
卷积神经网络模型
多地区
矩阵
门控循环单元
漂流浮标
轨迹预测方法
海洋环境要素
时间序列信息
时间序列预测模型
监控指标数据
预训练模型
意图识别
应用程序编程接口