摘要
本发明公开了基于混合压缩的文本提取方法、装置、设备以及介质,包括:得到待压缩文本的第一文本集合;对第一文本集合中的段落以及段落关键词,进行语义拓展和替换,得到若干个第二文本集合;以混合压缩比分别对第一文本集合的段落集合和第二文本集合的段落集合进行压缩剪裁,得到若干个第三文本集合;对若干第三文本集合进行筛选,得到若干第四文本集合;根据待压缩文本、第四文本集合的段落集合以及段落集合的字数,从若干第四文本集合中筛选出待压缩文本对应的压缩提取文本。本发明属于文本压缩领域。本发明可以保证文本压缩的同时实现语义最接近。
技术关键词
文本提取方法
关键词提取模型
文本提取装置
语义
电子设备
处理器
模块
介质
指令
存储器
数值
系统为您推荐了相关专利信息
负荷预测模型
初始聚类中心
多尺度特征金字塔
电力负荷预测方法
计算机执行指令
机器人控制方法
粒子群算法
位置更新
速度
机器人控制模块
车牌识别方法
特征融合网络
特征提取网络
号码
融合特征
预警信息生成方法
时空大数据
视频流
图像采集设备
关系网络