数据处理方法和装置

AITNT
正文
推荐专利
数据处理方法和装置
申请号:CN202411840013
申请日期:2024-12-13
公开号:CN119721027B
公开日期:2025-11-14
类型:发明专利
摘要
本申请实施例提供一种数据处理方法和装置,涉及人工智能技术领域,包括:对获取的待预测文本进行分词获得待预测词序列;针对待预测词序列中的每个分词迭代处理,分别执行步骤:获得待预测词序列中的第一分词分别与预设词库中各预设分词的语义邻接概率,和第一分词与邻接的第二分词的原始邻接概率,若原始邻接概率小于概率阈值,基于预设筛选条件和第二分词,从预设词典中选出多个候选分词;将与候选分词匹配的预设分词的语义邻接概率作为候选邻接概率,并将最大的候选邻接概率对应的候选分词作为目标分词,采用目标分词替换待预测词序列中的第二分词;以获得最终的待预测文本的目标文本。以提高数据清洗准确性和效率。
技术关键词
分词 序列 标签文本 语义 注意力机制 数据处理方法 词典 关系 翻译工具 数据处理装置 处理单元 人工智能技术 无监督 参数
系统为您推荐了相关专利信息
1
一种基于文本语义解读的配电网项目可研报告分析方法
报告分析方法 配电网项目 术语 文本处理模型 规则集
2
基于一致性与差异性解耦的多模态意图识别方法及系统
意图识别方法 音频特征 视频 序列特征 动态门控
3
一种面向需求响应的用户可调负荷评估方法及系统
面向需求响应 可调负荷 时序特征 负荷预测模型 电力信息处理技术
4
骶髂关节合成CT检查技术及其系统
CT检查技术 深度学习神经网络模型 深度学习模型 边缘检测算法 CT检查系统
5
一种动态人脸表情的识别方法与系统
动态人脸 彩色图像 静态特征 加权特征 识别方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号