一种节约算力的小参数量中文多音字消歧方法

正文

推荐专利

申请号：CN202510584401

申请日期：2025-05-07

公开号：CN120448550A

公开日期：2025-08-08

类型：发明专利

摘要

本发明涉及自然语言处理领域，公开了一种节约算力的小参数量中文多音字消歧方法。其特征在于，采用了小型中文预训练模型，解决了大规模预训练模型在进行多音字消歧任务时，难以在低资源运算平台部署，占用大量算力资源的问题。然后，将文本数据输入该预训练模型进行训练，得到相应的语义特征序列，同时加入中文分词和词性标注特征序列，并且使用双向LSTM和全连接层组成的分类器对其进行分类，进一步提高多音字消歧的准确率，验证分词和词性标注特征对于多音字消歧的有效性以及双向LSTM对于多音字分类的有效性。同时通过对比实验，验证本方法在多音字消歧方面的有效性和相比于使用大规模预训练模型的优越性。

技术关键词

消歧方法语义特征嵌入特征预训练模型中文分词汉字字符序列词语语句分类器数据标签继承有效性发音维基百科中文文本

系统为您推荐了相关专利信息

基于多通道WGAN的光子计数CT图像降噪方法

图像降噪方法低剂量CT图像多通道样本 Wasserstein距离度量

基于不确定性增强和主动学习优化的医学图像标注方法

医学图像标注方法标注医学图像分支样本预训练模型

基于大模型的流程事件响应方法

事件响应方法关键词视频参数预训练模型

一种社交媒体分析辅助的交互式抑郁智能检测方法

智能检测方法抑郁多模态交互式视频说话人识别技术

一种基于MEC-PA的轴承表面特征提取方法、系统和存储介质

特征提取方法全局平均池化空间注意力模型局部特征信息图像

一种节约算力的小参数量中文多音字消歧方法

站点导航

APP 下载