一种基于改进MacBERT-BiLSTM-CRF的中文地址分词方法

AITNT
正文
推荐专利
一种基于改进MacBERT-BiLSTM-CRF的中文地址分词方法
申请号:CN202510667696
申请日期:2025-05-22
公开号:CN120542420A
公开日期:2025-08-26
类型:发明专利
摘要
本发明公开了一种基于改进MacBERT‑BiLSTM‑CRF的中文地址分词方法,通过融合字形、拼音和文本信息,结合多层次数据增强策略,实现对中文地址文本的精确解析。本发明提出的多层级数据增强机制,包括语义保持型增强策略以及结构变化型增强策略,有效提高了模型对地址文本变体的适应能力。同时,本发明设计了特征融合编码器,通过多头注意力机制实现字形特征、拼音特征与文本特征的深度融合,并采用增强型条件随机场进行序列标注,构建了地址组成部分之间的结构化约束关系。本发明充分考虑了中文地址的语言特点和书写习惯,有机结合了上下文语义信息、字形视觉特征和拼音语音特征,克服了传统地址解析方法在处理地址变体和非规范表达时的不足,显著提升了中文地址分词的准确率和鲁棒性。
技术关键词
中文地址分词方法 字形特征 多头注意力机制 拼音 文本 条件随机场 中文地址数据 融合上下文信息 地址解析方法 上下文语义信息 标签 语音特征 序列标注模型 策略 样本 维特比解码 分类器 维特比算法
系统为您推荐了相关专利信息
1
一种媒资推荐方法、装置、设备、存储介质及产品
推荐方法 生成用户 序列 频道 前馈神经网络
2
基于生成式语言模型的文本分析方法、装置、设备及介质
文本分析方法 商品评论数据 计算机可执行指令 标签 终端
3
对话式数据分析方法、装置、存储介质及电子设备
自然语言文本 数据分析方法 数据分析装置 语义数据模型 指标
4
一种具备同步标注批改功能的高拍仪及同步标注批改方法
纸质文档 投影组件 边缘检测算法 电子补偿模块 批改方法
5
一种基于大模型智能教育活动管理系统以及方法
活动管理方法 活动管理系统 模型智能推荐 学习服务系统 智能决策支持
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号