基于多尺度特征的中文命名实体识别系统、方法、设备及介质

AITNT
正文
推荐专利
基于多尺度特征的中文命名实体识别系统、方法、设备及介质
申请号:CN202510250608
申请日期:2025-03-04
公开号:CN120409476A
公开日期:2025-08-01
类型:发明专利
摘要
基于多尺度特征的中文命名实体识别系统、方法、设备及介质,其方法为:通过预处理模块,将原始文本分解为字符序列,对字符进行预处理,包括去除标点符号、统一转换为小写;通过特征提取模块的RoBERTa‑WWM子模块负责将输入文本转换为高维特征向量,CNN子模块通过滑动窗口机制有效提取局部特征,BiLSTM子模块最终利用双向处理的优势,获取完整的上下文信息;通过序列标注模块使用动态条件随机场(CRF)解码隐藏状态表示,以确定最优的标签序列;本发明集成预训练、多尺度特征融合与动态解码技术,实现了高效、精准的中文实体识别;通过独特的预处理规则、模块化架构设计及优化的超参数配置,确保系统在复杂场景下的性能与鲁棒性。
技术关键词
中文命名实体 动态条件随机场 掩码策略 特征提取模块 序列 字符 标签 滑动窗口机制 文本规范化 高维特征向量 前馈神经网络 词语 识别系统 编码向量 矩阵 多尺度特征融合
系统为您推荐了相关专利信息
1
融合用户与任务特征的个性化负荷评估反馈方法和系统
反馈方法 大语言模型 评估反馈系统 生成方法 负荷
2
基于神经网络的图像特征提取与识别方法
图像特征提取 忆阻器阵列 识别方法 特征提取模块 拓扑方法
3
轨道交通线路平面线形投影的计算方法及系统
计算方法 坐标 线路 终点 方位角
4
一种以Prkar1a作为肥胖及其并发症治疗靶点的应用
高脂饮食诱导 动脉粥样硬化治疗 肝脏 心血管疾病治疗 小鼠模型
5
电池组件良品率的提升方法、存储介质和电子设备
电池组件 时间序列模型 随机森林模型 控制焊接设备 光伏组件电池
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号