-
公开(公告)号:CN119003795A
公开(公告)日:2024-11-22
申请号:CN202411481538.9
申请日:2024-10-23
Applicant: 浪潮电子信息产业股份有限公司
IPC: G06F16/36 , G06F16/33 , G06F40/284
Abstract: 本发明公开了一种基于检索增强生成的检索方法、产品、设备及介质,涉及自然语言处理技术领域。方案具体通过识别初始查询信息中的实体,能够帮助系统捕获用户查询中的关键信息和语义结构,从而提升查询理解的准确率;基于知识图谱对初始查询信息中的实体进行扩展,能够补充隐含的背景信息,使系统更好地处理不完整或模糊的查询;并且知识图谱的引入使系统能够利用领域特定的结构化知识,更好地理解和处理专业领域的查询;同时,知识图谱可以便捷地扩展或替换为不同领域的专业知识库,提高了系统的适应性。在语义匹配过程中,将关键词匹配与语义匹配相结合,多层语义匹配能够更全面地理解用户查询意图和待检索的文本块内容,显著地提升了检索精度。
-
公开(公告)号:CN113839815B
公开(公告)日:2024-11-01
申请号:CN202111111033.X
申请日:2021-09-18
Applicant: 浪潮电子信息产业股份有限公司
Inventor: 张国奇
IPC: H04L41/0803 , H04L41/0663 , H04L12/46
Abstract: 本发明提供一种服务器网口配置方法、装置、服务器及介质,方法包括:当检测到故障转移模式被启动时,判断是否配置有虚拟局域网ID;若配置有虚拟局域网ID,则判断能否利用虚拟局域网ID获取到对应的虚拟局域网配置信息;若能获取到虚拟局域网配置信息,则利用虚拟局域网配置信息配置共享网口;若未配置虚拟局域网ID或不能获取到虚拟局域网配置信息,则关闭故障转移模式,获取共享网络配置信息,并利用共享网络配置信息配置共享网口;本发明仅在虚拟局域网ID及对应配置信息均有时才对共享网口配置虚拟局域网,而在信息缺失时将会为共享网口配置共享网络,可确保服务器共享网口通信顺畅,进而避免由虚拟局域网配置失败导致的通信阻断问题。
-
公开(公告)号:CN118838859A
公开(公告)日:2024-10-25
申请号:CN202411329392.6
申请日:2024-09-24
Applicant: 浪潮电子信息产业股份有限公司
IPC: G06F13/28
Abstract: 本发明公开了一种数据传输方法、产品、设备及介质,涉及计算机技术领域。本方案在加速器端设置了微控制器,用于接收主机端发送的DMA配置信息,并将DMA配置信息传输至加速器端的处理器,即采用带外配置的方式,能够一次性接收多个DMA配置信息,避免了等待一次配置信息传输完成才能发起下次传输,有效地提高了数据传输效率;同时,由于加速器端是由微控制器对DMA传输进行控制,处理器只负责进行数据传输和计算,因此减小了处理器的逻辑开发难度。此外,方案分别采用第一通信总线传输DMA配置信息,通过第二通信总线传输DMA配置信息对应的目标数据,可实现DMA操作的实时执行,提高了数据传输的实时性。
-
公开(公告)号:CN118466859B
公开(公告)日:2024-10-11
申请号:CN202410924980.8
申请日:2024-07-11
Applicant: 浪潮电子信息产业股份有限公司 , 华中科技大学
Abstract: 本发明公开了一种数据处理方法、系统、存储集群、设备及可读存储介质,涉及存储领域,为解决采用多层耦合码修复速度慢的问题,该数据处理方法包括通过多层耦合码将原始数据划分为若干个数据块和校验块,并将各个数据块和各个校验块均划分为若干个子块后进行编码,得到每一子块的原始编码;获取格雷码序列,按格雷码序列及原始编码调整各个子块的排列顺序,按照调整后的排列顺序将各个子块写入对应的存储节点;当满足单块数据修复条件时,通过多层耦合码确定故障块,从存储节点中读取故障块对应的待访问子块,通过待访问子块对故障块进行数据修复。本发明能够将对子块大量的随机访问转换为少量的顺序访问,从而减少修复访问数量,提高修复效率。
-
公开(公告)号:CN118690010A
公开(公告)日:2024-09-24
申请号:CN202410867700.4
申请日:2024-06-30
Applicant: 浪潮电子信息产业股份有限公司
IPC: G06F16/338 , G06F16/33 , G06F16/58 , G06F16/583
Abstract: 本发明提供一种文本生成方法、装置、电子设备、程序产品及存储介质,涉及人工智能领域,方法包括:接收输入图像和输入文本,并分别对输入图像和输入文本进行编码,得到图像表征向量和文本表征向量;利用图像表征向量对文本表征向量进行交叉注意力处理,并对交叉注意力处理结果进行自注意力处理得到特征提取向量;对特征提取向量进行逻辑计算,得到根据输入图像和输入文本二者的语义所生成的输出文本;可通过调整图像与文本间的特征交互方式,避免产生输入序列长度的二次方的计算增加,进而可减少模型的算力需求,并能够有效提升用户的使用体验。
-
公开(公告)号:CN118276787B
公开(公告)日:2024-09-17
申请号:CN202410704392.3
申请日:2024-06-03
Applicant: 浪潮电子信息产业股份有限公司
Abstract: 本发明公开了一种数据压缩存储方法、装置、系统、介质及计算机程序产品,涉及存储技术领域,该方法应用于存储控制侧的第一数据处理器网卡,第一数据处理器网卡与存储控制侧的中央处理器连接,且第一数据处理器网卡通过网络与存储侧的第二数据处理器网卡连接,第二数据处理器网卡连接存储侧的各个硬盘;该方法由第一数据处理器网卡进行数据压缩,中央处理器不再负责数据压缩,可以降低中央处理器的使用率,节省中央处理器的I/O处理程序,提升性能。同时,第一数据处理器将数据压缩后传输到第二数据处理器网卡,由第二数据处理器网卡将压缩后的数据写入硬盘,可以降低数据在网络中的传输量,提升网络带宽使用率,避免网络拥塞带来的性能瓶颈。
-
公开(公告)号:CN118410854B
公开(公告)日:2024-09-13
申请号:CN202410882270.3
申请日:2024-07-03
Applicant: 浪潮电子信息产业股份有限公司
Inventor: 申冲
IPC: G06N3/088 , G06F16/35 , G06N3/0499
Abstract: 本发明公开了模型训练及文本处理方法、计算机程序产品、设备、介质,涉及人工智能技术领域,获取有标签的第一文本,第一文本的长度大于设定长度值,标签用于标记文本中相似的句子;将第一文本切分成文本块;确定文本块对应的文本向量值;对文本向量值进行聚类,得到聚类结果;基于第一文本和聚类结果对文本处理模型进行训练,且文本处理模型用于将文本转换为对应的向量。由于聚类是将相似的对象聚合在一起,所以聚类结果反映了文本向量值间的相似关系,相当于应用第一文本、文本向量值和文本向量值间的相似关系对文本处理模型进行训练,可以避免模型训练时不相干内容的噪音干扰,提高向量空间表征范围,提高文本处理模型对长文本的处理准确性。
-
公开(公告)号:CN118395194B
公开(公告)日:2024-09-13
申请号:CN202410853483.3
申请日:2024-06-28
Applicant: 浪潮电子信息产业股份有限公司
IPC: G06F18/214 , G06N3/0464 , G06F8/41
Abstract: 本发明公开了一种模型训练方法、产品、设备及计算机可读存储介质,涉及分布式训练领域,为解决上层训练框架和加速装置之间兼容难度大的问题,该模型训练方法包括在与通用接入平台连接的多个备选加速装置中确定目标加速装置;通用接入平台包括多个待编译模块;基于满足目标加速装置的运行需求的编译信息对至少一个待编译模块中定义的虚拟方法进行实例化,以创建方法实例;控制当前训练框架在当前训练阶段调用对应的待编译模块中的方法实例训练预设模型。本发明能够降低分布式训练中的上层训练框架和加速装置之间的兼容难度,无需对加速装置进行适配开发,降低加速装置的开发难度和维护难度。
-
公开(公告)号:CN118567576A
公开(公告)日:2024-08-30
申请号:CN202411035780.3
申请日:2024-07-31
Applicant: 浪潮电子信息产业股份有限公司
Abstract: 本发明公开了一种多控存储器系统及其数据存储方法、设备、介质、产品,应用于存储技术领域。其中,方法包括将主机下发的写请求拆分为多个子请求,并下发至各控制节点,以使其查询相应数据是否已存在系统。若存在故障控制节点,则根据故障控制节点类型、故障控制节点的子请求查询响应情况及非故障控制节点的子请求查询响应情况,选择将数据写请求先回收并在继续处理业务过程中再次执行数据写请求,还是释放非故障控制节点的子请求数据结构;若不存在故障控制节点,则没有被存储的子数据进行存储,并将存储地址发送至对应子请求归属的控制节点。本发明可以解决节点故障引起的写请求异常的问题,能够保证多控存储器系统对主机的写请求的正常处理。
-
公开(公告)号:CN118279126B
公开(公告)日:2024-08-30
申请号:CN202410696331.7
申请日:2024-05-31
Applicant: 浪潮电子信息产业股份有限公司
Abstract: 本发明公开了一种图形处理单元显存处理方法、服务器、产品、设备及介质,涉及图形处理单元技术领域。在图形处理单元的显存不满足所需的内存请求的情况下,将位于图形处理单元显存内的访问频次小于预设次数的物理页面迁移至主机内存,提高了图形处理单元的可用性和利用率。通过记录物理页面的访问频次,能够准确地确定出各物理页面的访问情况,进而准确地将位于图形处理单元显存内的第一物理页面移动到主机的内存中;主机和图形处理单元之间通过计算快速链路协议以及基于访问频次的情况进行物理页面的移动,实现了图形处理单元的显存与主机内存的上层无感知的内存调度交换,提高了图形处理单元显存处理的通用性,适用于不同的AI模型的处理需求。
-
-
-
-
-
-
-
-
-