-
公开(公告)号:CN117955921A
公开(公告)日:2024-04-30
申请号:CN202410184147.4
申请日:2024-02-19
Applicant: 湖南大学
IPC: H04L47/263 , H04L47/35
Abstract: 一种基于RDMA通信的网络流速率的控制方法,包括以下步骤:控制器获取当前RDMA流的当前速率与目标速率以及网络数据传输速率信息;2)控制器根据步骤1)的当前速率与目标速率以及网络数据传输速率信息计算得出当前数据包发送的最佳发送速率;3)控制器按照步骤2)计算出的最佳发送速率,改变该数据包中携带的链路拥塞信息;4)网卡根据步骤3)修改或者添加后的流速率信息,调整发送速率发送后续数据包。本发明的基于RDMA通信的网络流速率的控制方法的控制器可以设置在网卡中,也可以设置在交换机或者设置在独立于网卡与交换机的硬件模块上,这使得本发明的网络流速率的控制方法可以以灵活、低成本的方式进行实现与部署。
-
公开(公告)号:CN115277419B
公开(公告)日:2024-01-26
申请号:CN202210947340.X
申请日:2022-08-09
Applicant: 湖南大学
IPC: H04L41/0823 , H04L67/141 , H04L12/46
Abstract: 一种无服务计算中加速网络启动方法及系统,包括以下步骤:1)整合网络命名空间,针对一组容器创建一个PartFast网络命名空间;2)VTEP网络命名空间中创建一对VETH设备,其中一个VETH设备放入PartFast网路命名空间、另一个本地的VETH设备和VTEP的VXLAN以及网桥接口拴住,然后启动本地VETH和客户VETH接口;3)针对PartFast网络命名空间,设置IP和MAC;4)在本地VETH和客户VETH接口之间建立一个连接;本发明通过在VTEP netns中创建一对VETH设备,减少了一次虚拟网卡移动次数。此外,本发明引入了提前创建网络以及暂停容器池的管理,减少了容器
-
公开(公告)号:CN111612155B
公开(公告)日:2023-05-05
申请号:CN202010411839.X
申请日:2020-05-15
Applicant: 湖南大学
Abstract: 本发明公开了一种分布式机器学习系统及适用于其的通信调度方法,其方法为:在分布式机器学习系统的参数服务器或交换机的网络芯片上增设自动机,通过自动机识别分布式机器学习系统中的参数服务器和工作节点;参数服务器依次向每个工作节点发送对应分配的参数,在同一时间点只向一个工作节点发送对应分配的参数;每个工作节点从参数服务器拉取到参数后,均立即开始根据参数计算梯度;每个工作节点在完成梯度计算后,判断此时的参数服务器是否在接收其他工作节点推送的梯度,若否,则将当前工作节点计算得到的梯度推送给参数服务器。本发明对分布式机器学习系统的通信进行合理调度,有效降低分布式机器学习的通信时间成本。
-
公开(公告)号:CN115525408A
公开(公告)日:2022-12-27
申请号:CN202211028074.7
申请日:2022-08-25
Applicant: 湖南大学
Abstract: 一种保障服务质量的无服务计算系统,包括HTTP网关、调度器和工作池;HTTP网关将传来的DAG请求经过序列化器进行序列化,将序列化的DAG请求中的无服务函数依次加入到等待队列中;调度器将根据调度策略从等待队列和链运行队列中调取无服务函数到工作池中进行处理。本发明的障服务质量的无服务系统和方法通过对平台内的调度器进行改造,通过生产者‑‑消费者模式,来对传来的请求进行处理。此外,通过添加含有丰富策略的策略框架。针对不同种类的应用请求,设置不同种类的策略,从而在一定程度上减少排队时间,改善运行性能。
-
公开(公告)号:CN112260971B
公开(公告)日:2021-11-16
申请号:CN202011130912.2
申请日:2020-10-21
Applicant: 湖南大学
IPC: H04L12/947 , H04L12/939 , H04L12/751 , H04L12/24
Abstract: 本申请涉及一种网络设备系统的容错方法、装置、计算机设备和存储介质,该系统包括:源交换机、第一交换机组、第二交换机组、主控制器和辅控制器,该方法包括:当链路状态发生变化时,源交换机获取并向主控制器发送链路状态变化信息,从第一交换机组或第二交换机组中随机选取交换机并发送链路状态变化信息的副本;由主控制器将链路变化状态信息转发给第二交换机组;辅控制器接收源交换机选取的交换机发送的链路状态变化信息的副本并发送给第二交换机组;第二交换机组根据获得的信息更新本地路由表后,由主控制器向源交换机发送确认信息。采用本申请实施例的冗余的信息传输方法,能够有效提高网络设备系统的容错能力。
-
公开(公告)号:CN111612155A
公开(公告)日:2020-09-01
申请号:CN202010411839.X
申请日:2020-05-15
Applicant: 湖南大学
Abstract: 本发明公开了一种分布式机器学习系统及适用于其的通信调度方法,其方法为:在分布式机器学习系统的参数服务器或交换机的网络芯片上增设自动机,通过自动机识别分布式机器学习系统中的参数服务器和工作节点;参数服务器依次向每个工作节点发送对应分配的参数,在同一时间点只向一个工作节点发送对应分配的参数;每个工作节点从参数服务器拉取到参数后,均立即开始根据参数计算梯度;每个工作节点在完成梯度计算后,判断此时的参数服务器是否在接收其他工作节点推送的梯度,若否,则将当前工作节点计算得到的梯度推送给参数服务器。本发明对分布式机器学习系统的通信进行合理调度,有效降低分布式机器学习的通信时间成本。
-
公开(公告)号:CN110333987A
公开(公告)日:2019-10-15
申请号:CN201910597798.5
申请日:2019-07-04
Applicant: 湖南大学
Abstract: 本申请提供了一种设备体检报告生成方法、装置、计算机设备和存储介质,首先,采用分布式训练模式对LSTM神经网络进行训练,减少了网络链路中构建有LSTM神经网络的节点的数据处理量,提高数据的处理速度,基于网络流量调度方法对分布式训练模式进行优化,减少各节点的通信时间,然后,使用关联分析算法,提取出关键的设备的故障特征,基于这些故障特征,使用基于网络流量调度方法优化后的分布式训练模式进行训练得到的LSTM神经网络进行故障诊断,能够实现对设备故障的准确诊断与预测,最后,使用注意力机制将诊断预测的结果高效生成文本形式的体检报告。
-
-
-
-
-
-