一种基于历史文档词统计与词对齐方法的术语对提取方法、装置及介质

AITNT
正文
推荐专利
一种基于历史文档词统计与词对齐方法的术语对提取方法、装置及介质
申请号:CN202411092229
申请日期:2024-08-09
公开号:CN118966199A
公开日期:2024-11-15
类型:发明专利
摘要
本发明属于机器翻译技术领域,提供了一种基于历史文档词统计与词对齐方法的术语对提取方法、装置及介质,其中方法包括:(1)基于历史文档构建语料库;(2)每个历史文档进行分词;(3)输入文档进行分词;(4)遍历集合中的所有词;(5)得到术语集合。本发明通过历史文档作为判断依据,可以解决某些高频词并非为术语,但被识别为术语的问题,且不需要引入词性判断步骤,减少了判断误差。
技术关键词
对齐方法 术语 机器翻译技术 正确率 存储计算机程序 中文分词 判断误差 存储器 处理器 代表 可读存储介质
系统为您推荐了相关专利信息
1
一种脱销控制方法及相关装置
参数 策略 电子设备 计算机存储介质 存储计算机程序
2
一种输电线路覆冰舞动预测方法
输电线路覆冰厚度 代表 风速 输电线路技术 气候
3
光学衍射神经网络系统
神经网络系统 事件相机 闪耀光栅 光路系统 并行处理单元
4
一种基于AI反馈的文本生成图像优化方法、装置及介质
文本生成图像 大语言模型 文本编码器 反馈优化方法 对齐模块
5
基于多模块协同的病案质控管理方法及相关装置
数据 关键字 多模块 管理方法 语义
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号