摘要
本发明公开了一种面向大数据的自然语言增强数据分析方法及系统,涉及自然语言转化管理技术领域,历史查询数据采集模块、语言文本筛选模块、查询信息采集模块、信息检索规划模块和检索规划优化模块;通过历史查询数据采集模块采集用户的历史检索信息和历史自然语言文本,对历史自然语言文本进行归类预处理;通过语言文本筛选模块筛选优选自然语言文本并生成优选数据库;通过查询信息采集模块识别当前用户的语音并转换成自然语言文本;通过信息检索规划模块规划待转化文本的选择方式,将待转化文本转化为sql并进行信息检索;通过检索规划优化模块优化待转化文本的选择方式,降低了因待转化文本使用不当导致信息不满足用户需求的概率。
技术关键词
自然语言文本
信息检索
面向大数据
语义
数据分析方法
信息采集模块
数据采集模块
数据分析系统
规划
生成自然语言
语音识别技术
信息采集单元
偏差
生成训练数据
分析单元
系统为您推荐了相关专利信息
自然语言理解技术
智能检索方法
构建用户画像
交互历史
查询意图
背景替换方法
上下文特征
多尺度
电商
条件随机场