一种面向云计算的GPU虚拟化系统和方法

    公开(公告)号:CN113986466A

    公开(公告)日:2022-01-28

    申请号:CN202111282139.6

    申请日:2021-11-01

    Abstract: 本发明涉及一种面向云计算的GPU虚拟化系统和方法,属于计算机领域。本发明将CUDA改造成为适用于多虚拟机系统的vCUDA。通过vCUDA多模块设计解决多虚拟机间资源通信和调度、在用户层拦截和重定向CUDA API、使用远程过程调用作为特殊的域间通信机制等方式,实现本专利GPU虚拟化技术。本发明设计vCUDA在云计算平台虚拟机上的实现方式,满足不同用户对GPU资源的复用,在虚拟机上实现通用并行计算。本发明通过用户层拦截和重定向CUDA API,不改变虚拟机和GPU自身内核,对原装软件和硬件无侵入。对于客户虚拟机上部署的CUDA应用程序而言,所有的操作都像发生在本地。可使云计算平台成为一个虚拟化GPU资源可用复用、可进行并行计算任务分发、调度可行有效率的计算平台。

    基于神经网络和分布式缓存的Kubernetes集群资源混合调度方法

    公开(公告)号:CN113806018A

    公开(公告)日:2021-12-17

    申请号:CN202111070586.5

    申请日:2021-09-13

    Abstract: 本发明涉及一种基于神经网络和分布式缓存的Kubernetes集群资源混合调度方法,属于资源调度领域。本发明通过采集应用历史运行情况相关信息,训练BP神经网络,构建基于kubernetes的资源预测模型;对应用当前所需要使用的资源进行预测,并将相应预测结果输入到分布式缓存系统;资源调度算法从分布式缓存系统获取预测结果,针对不同种类的资源,资源动态调度算法会生成一系列资源借贷决策,并将决策响应到容器组的请求资源限制中。本发明使用预测模型预测未来一段时间内应用的负载情况,根据资源预测结果帮助Kubernetes集群在应用由于资源不足出现性能瓶颈之前预先触发资源的动态调度和实例的自动伸缩,从而减少服务的实际响应时间。

Patent Agency Ranking