政务服务领域的快速无监督词库构建方法、系统、设备和介质

AITNT
正文
推荐专利
政务服务领域的快速无监督词库构建方法、系统、设备和介质
申请号:CN202411634751
申请日期:2024-11-15
公开号:CN119494337A
公开日期:2025-02-21
类型:发明专利
摘要
本发明公开政务服务领域的快速无监督词库构建方法、系统、设备和介质,方法包括:对政务服务领域语料进行清洗,得到语料库;统计语料库中的词片段;计算所有词片段的互信息熵,将互信息熵高于阈值的词片段添加到初始词库中;基于初始词库对语料库中的政务服务领域语料进行分词,切分后的词语保存在字典中;遍历字典,删去不合规的词语,保留有语义价值的词语组成无监督词库。本发明以提高无监督词库构建的准确性和效率,具有广泛的应用前景。
技术关键词
词库构建方法 无监督 政务 词语 信息熵计算方法 字典 分词 语义 构建系统 文本 处理器 模块 可读存储介质 频率 存储器 计算机 电子设备
系统为您推荐了相关专利信息
1
基于FTTR网络的远程故障诊断方法、系统及存储介质
远程故障诊断方法 无监督学习算法 消息队列系统 数据采集单元 监控模块
2
一种无监督的单目深度和光流估计方法及装置
运动信息编码 无监督 子模块 上下文特征 编码器
3
一种基于RAG和对比学习的Tor语料高效标注方法
高效标注方法 文本 标签 大语言模型 数据
4
一种多模态目标数据智能化处理系统
现场视频图像 图像局部特征 数据存储管理 视频帧 分析模块
5
基于因果特征交互的遥感图像跨域变化检测方法
变化检测方法 遥感图像变化检测 残差模块 输出特征 水平高频分量
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号