一种基于决策咨询服务的关键词提取数据集制作方法

AITNT
正文
推荐专利
一种基于决策咨询服务的关键词提取数据集制作方法
申请号:CN202411640149
申请日期:2024-11-18
公开号:CN119597803A
公开日期:2025-03-11
类型:发明专利
摘要
本发明公开了一种基于决策咨询服务的关键词提取数据集制作方法,包括以下步骤:S1,使用Python语言中的Selenium库抓取网页文本数据并进行数据清洗;S2,连接MySQL数据库,将抓取的数据按时间、标题、内容等维度存储,以确保数据的结构化管理;S3,对标题和文本内容的数据进行中文分词与去除停用词;S4,在Transformer模型的框架下,引入标题信息融入注意力机制的计算,通过标题向量和注意力的结合,引导模型生成关键词;S6,通过余弦相似度测量关键词与原文本的语义相似度,从而筛选出更为精准的关键词。本发明不仅实现了数据抓取和数据集制作功能,同时通过集成标题注意力机制和余弦相似度,提升了关键词提取的精确性。
技术关键词
数据集制作方法 生成关键词 中文分词 决策 解码器 抓取网页 编码器 中文文本 中文关键词 文档关键词 多头注意力机制 语义 序列 符号 格式
系统为您推荐了相关专利信息
1
一种考虑退化信息自适应表征的电池健康估计方法
估计方法 锂离子电池 优化神经网络 策略 编码器
2
情感可控脸部动画生成方法、装置、设备及介质
人脸模型 动画生成方法 视频 音频编码器 参数估计算法
3
一种树脂生产废气回收控制方法及系统
回收控制方法 过渡工况 补偿滤波器 废气 PID控制器
4
船舶远程驾驶光场感知的边缘服务模型优化方法及系统
模型优化方法 卸载策略 时延 深度强化学习 视点渲染
5
一种基于知识图谱与联邦学习的仿真系统智能决策方法及系统
智能决策方法 仿真系统 构建知识图谱 节点 联邦模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号