一种基于多种模态信息的中文拼写纠错方法

AITNT
正文
推荐专利
一种基于多种模态信息的中文拼写纠错方法
申请号:CN202410725181
申请日期:2024-06-05
公开号:CN118627494A
公开日期:2024-09-10
类型:发明专利
摘要
本发明提供一种基于多种模态信息的中文拼写纠错方法,使用文本的语义信息、汉字的发音信息和字形信息,在发音信息中融入了拼音字母在键盘上的坐标信息,使得模型能够感知拼音字母在键盘上的位置信息,以提升模型对于拼音输入的错误文本的纠错性能;在字形信息中融入的每个汉字的图像,提升模型对于手写输入的错误文本的纠错性能。最后,通过特征融合的模块,将多种模态的信息选择性地进行融合,使模型能够处理不同输入方式产生的错误。
技术关键词
拼写纠错方法 汉字 拼音 发音特征 编码 代表 键盘 模态特征 字形特征 序列 二维位置信息 文本 语义特征 坐标 字符 字母 融合语义
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号