大模型的数据处理方法、装置、设备及介质

AITNT
正文
推荐专利
大模型的数据处理方法、装置、设备及介质
申请号:CN202511046957
申请日期:2025-07-29
公开号:CN121029652A
公开日期:2025-11-28
类型:发明专利
摘要
本发明提供一种大模型的数据处理方法、装置、设备及介质,应用于芯片,所述芯片包括PNM、SIP和DMA,所述SIP和所述PNM之间设置有生产者‑消费者模型,且两者动态交替扮演生产者和消费者。本发明通过DMA负责从外部存储器加载数据到共享缓存;在大模型的预填充阶段和生成阶段,计算任务被分配给PNM和SIP两个单元;PNM和SIP之间动态交替扮演生产者和消费者的角色;通过这种协同工作方式,充分利用了芯片的计算资源,提高了处理效率和吞吐量。从而在大模型的端侧应用中,能够有效协调PNM、SIP和DMA之间的协同工作,解决存储带宽和容量问题,提高模型的推理效率和性能。
技术关键词
执行矩阵乘法 注意力 队列 数据处理方法 编码 存储器 芯片 阶段 序列 可读存储介质 存储计算机程序 数据处理装置 动态 电子设备 参数 处理器 多线程 模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号