一种应用于边缘设备的大语言模型流水线推理架构

    公开(公告)号:CN119440632A

    公开(公告)日:2025-02-14

    申请号:CN202411471669.9

    申请日:2024-10-21

    Abstract: 本发明公开了一种应用于边缘设备的大语言模型流水线推理架构,涉及大语言模型领域,本发明提出了一种内存高效的流水线执行机制,即PIPELOAD,针对其实际应用提出了Hermes架构由层分析器、流水线规划器和执行引擎三部分组成;层分析器是对给定的Transformer模型中的每一层进行分析,以评估其运行性能和内存使用情况;利用层分析器生成的数据,所述流水线规划器通过改变加载代理数量以生成在不同内存限制下的执行计划;在确定执行计划后,模型推理将根据边缘设备的当前的实际内存约束,在所述执行引擎中,遵从由流水线规划器生成的对应执行计划,按照该计划中的加载代理数量进行执行。本发明有效解决了流水线阻塞的问题和在边缘设备上部署大模型时内存受限的问题。

    一种面向工业大数据的无服务器流计算应用构建方法

    公开(公告)号:CN116627673A

    公开(公告)日:2023-08-22

    申请号:CN202310609950.3

    申请日:2023-05-26

    Abstract: 本发明公开了一种面向工业大数据的无服务器流计算应用构建方法,涉及工业大数据领域。智能制造设备上传数据源到对象存储桶,触发预处理算子生成无服务器计算实例,对源数据进行预处理;预处理算子将预处理完的数据推送到指定的消息队列;基于消息队列事件触发的数据处理算子生成无服务器计算实例,从消息队列接收数据并进行处理;数据处理算子实例将处理完的数据继续上传到指定的消息队列,实现将数据传输给下一处理单元;所设定的数据处理算子流式处理数据,最后一个算子将结果持久化存储在NoSQL型数据库中。本发明为制造企业提供了一种行之有效且开发运维门槛较低的基于无服务器的流计算应用构建方式。

    一种面向航空分布式计算的实时分散流计算应用框架

    公开(公告)号:CN116594776A

    公开(公告)日:2023-08-15

    申请号:CN202310581773.2

    申请日:2023-05-22

    Abstract: 本发明公开了一种面向航空分布式计算的实时分散流计算应用框架,涉及分布式计算领域,包括主节点和从节点,主节点构建并管理分布式集群,从节点对分布式集群中的任务进行处理;包括如下步骤:主节点启动应用服务,构建分布式集群;从节点向主节点注册并成为工作节点;工作节点发布计算任务,向其他空闲工作节点发送任务请求,构建局部分散计算集群;将计算任务抽象为任务拓扑,执行任务调度算法为工作节点分配工作任务;工作节点启动对应的任务处理服务;开始输送源数据,各节点流式处理传入数据,并传输给下一节点,直至任务结束。本发明根据各工作节点的计算能力分配计算任务,流式处理源数据,平衡各设备的计算开销,优化了系统的实时性能。

    一种面向无服务器计算的多线程执行与资源安全共享的云计算系统

    公开(公告)号:CN119396548A

    公开(公告)日:2025-02-07

    申请号:CN202411440822.1

    申请日:2024-10-15

    Abstract: 本发明公开了一种面向无服务器计算的多线程执行与资源安全共享的云计算系统,涉及无服务计算领域。本发明提出了多线程资源共享并行安全执行模型,由多线程高效并行执行、多线程资源安全共享模块组成;所述多线程高效并行执行提出了一种针对函数单实例的线程级别资源管理机制,允许对每个线程的资源分配进行精确控制,同时设计了容器内顺序执行机制;在所述多线程资源安全共享模块中,MPK保护机制是线程内存安全的核心组成部分,MPK提供了每线程内存保护,允许在不同线程之间创建内存隔离区域,从而增强了数据安全性。本发明不仅保证了任务执行的顺序性,而且通过资源的恢复和共享,提高了容器的运行效率和资源利用率。

Patent Agency Ranking