Invention Publication
- Patent Title: 用于检测跨分片访问、提供多分片推理缩放和提供最佳页迁移的多分片存储器管理
-
Application No.: CN202080014501.9Application Date: 2020-03-14
-
Publication No.: CN113424148APublication Date: 2021-09-21
- Inventor: L·斯特瑞拉马萨尔马 , P·苏提 , V·乔治 , B·阿什博 , A·阿南塔拉曼 , V·安德烈 , A·阿普 , N·加洛坡冯伯里斯 , A·科克 , M·麦克弗森 , S·马伊尤兰 , N·米斯特里 , E·乌尔德-艾哈迈德-瓦勒 , S·帕内尔 , V·兰加纳坦 , J·雷 , A·沙阿 , S·坦格里
- Applicant: 英特尔公司
- Applicant Address: 美国加利福尼亚
- Assignee: 英特尔公司
- Current Assignee: 英特尔公司
- Current Assignee Address: 美国加利福尼亚
- Agency: 永新专利商标代理有限公司
- Agent 刘瑜
- Priority: 62/819,435 20190315 US 62/819,337 20190315 US 62/819,361 20190315 US
- International Application: PCT/US2020/022836 2020.03.14
- International Announcement: WO2020/190798 EN 2020.09.24
- Date entered country: 2021-08-13
- Main IPC: G06F9/38
- IPC: G06F9/38 ; G06F12/0862 ; G06F9/30

Abstract:
本文公开了用于检测跨分片访问、利用经由复制操作的数据多播提供多分片推理缩放和提供页迁移的多分片存储器管理。在一个实施例中,一种用于多分片架构的图形处理器包括:第一图形处理单元(GPU),其具有存储器和存储器控制器;第二图形处理单元(GPU),其具有存储器;以及跨GPU结构,其用于通信地耦合第一GPU和第二GPU。存储器控制器被配置为:确定在多GPU配置中从第一GPU到第二GPU的存储器是否发生频繁的跨分片存储器访问;以及当从第一GPU到第二GPU的存储器发生频繁的跨分片存储器访问时,发送消息以发起数据传送机制。
Information query