-
公开(公告)号:CN118519764A
公开(公告)日:2024-08-20
申请号:CN202410585599.3
申请日:2024-05-11
申请人: 阿里巴巴达摩院(杭州)科技有限公司
发明人: 陈峰
摘要: 本申请公开了一种算子确定方法、装置、存储介质、计算机设备及程序产品,涉及大模型技术、硬件加速领域。其中,该方法包括:获取深度学习模型,以及获取硬件加速单元的通用硬件信息,通用硬件信息用于描述硬件加速单元的计算能力;根据通用硬件信息,采用多种划分方式分别将深度学习模型的原始张量划分为张量数据块,得到多种划分方式对应的多个张量数据块集合;生成与多个张量数据块集合对应的多个模型执行程序,每个模型执行程序包括对应的原始算子配置;采用硬件加速单元分别执行模型执行程序,得到推理性能结果,进而确定目标算子配置。本申请解决了针对特定的深度学习模型和硬件平台进行算子搜索时无法兼顾搜索效率和搜索泛用性的技术问题。
-
公开(公告)号:CN118379464A
公开(公告)日:2024-07-23
申请号:CN202410508838.5
申请日:2024-04-25
申请人: 阿里巴巴达摩院(杭州)科技有限公司
摘要: 本说明书实施例提供对象生成方法、对象生成模型训练方法及3D对象生成方法,其中所述对象生成方法,包括:确定对象生成任务,其中,所述对象生成任务中包含初始对象图像;将所述初始对象图像输入对象生成模型,获得所述初始对象图像对应的目标对象,其中,所述初始对象图像的维度与所述目标对象的维度不同,所述对象生成模型包括特征处理模块和对象生成模块,所述特征处理模块用于对所述初始对象图像对应的图像特征进行维度转换处理,获得对象特征,所述对象生成模块用于根据所述图像特征以及所述对象特征生成所述目标对象;从而实现了利用对象处理模型生成与初始对象图像准确对应的目标对象。
-
公开(公告)号:CN113743128B
公开(公告)日:2024-07-05
申请号:CN202111079851.6
申请日:2021-09-15
申请人: 阿里巴巴达摩院(杭州)科技有限公司
IPC分类号: G06F40/35 , G06N3/0499 , G06N3/0895
摘要: 本申请公开了一种获取对话语义表示的方法和语义表示模型训练方法及装置,通过引入角色级响应选择自监督任务,实现了多角色对话在无标注的情况下的自监督训练和优化,摆脱了对话表示学习对于标签的依赖;通过引入角色级自注意力机制,实现了语义表示模型自动学习,对多角色对话表示具有更加重要意义的发言,使得对话语义表示具备了更加良好的效果。本申请实施例中,将利用数据中的固有特征实现的自监督学习应用于多角色对话的实现中,摆脱了对监督学习中的标签的依赖的,不仅降低了实现成本,而且也提升了实现多角色对话的效果,简单、有效地实现了多角色对话。
-
公开(公告)号:CN114143909B
公开(公告)日:2024-06-21
申请号:CN202111481909.X
申请日:2021-12-06
申请人: 阿里巴巴达摩院(杭州)科技有限公司
摘要: 本申请实施例提供了一种数据传输方法、可插拔转换设备及计算机存储介质,其中,数据传输方法包括:通过与拾音设备之间建立的基于第一通用无线通信协议的第一无线通信连接,接收所述拾音设备发送的连接请求,所述连接请求用于请求建立基于第二通用无线通信协议的无线通信连接;响应于所述连接请求,建立与所述拾音设备之间的第二无线通信连接,所述第一无线通信连接和所述第二无线通信连接为不同的连接;使用所述第二无线通信连接从所述拾音设备获取待传输数据,并将所述待传输数据封装为符合与目标设备进行数据传输所使用的数据传输协议的数据。通过本申请实施例,大大提高了音频数据传输的灵活性。
-
公开(公告)号:CN118133811A
公开(公告)日:2024-06-04
申请号:CN202410178350.0
申请日:2024-02-08
申请人: 阿里巴巴达摩院(杭州)科技有限公司
IPC分类号: G06F40/216 , G06F40/211 , G06F40/35
摘要: 本申请公开了一种文本处理方法、电子设备、存储介质和程序产品,涉及大模型技术、自然语言处理领域。其中,该方法包括:获取待处理文本和多个处理示例,其中,多个处理示例中包含至少一个正确示例和至少一个对比示例;利用至少一个正确示例对待处理文本进行处理,得到第一处理结果的概率分布,并利用至少一个对比示例对待处理文本进行处理,得到第二处理结果的概率分布;基于第一处理结果的概率分布和第二处理结果的概率分布,确定待处理文本的目标处理结果。本申请解决了相关技术中对待处理文本进行处理的准确度较差的技术问题。
-
公开(公告)号:CN118077199A
公开(公告)日:2024-05-24
申请号:CN202280066443.3
申请日:2022-09-29
申请人: 阿里巴巴达摩院(杭州)科技有限公司
发明人: 穆罕默德·G·萨维尔 , 叶琰 , 陈杰 , 廖如伶
IPC分类号: H04N19/176 , H04N19/18 , H04N19/70 , H04N19/88
摘要: 提供了一种VVC标准编码器和VVC标准解码器,其利用残差系数的排序顺序和TB的扩展区域来实现残差符号预测方法。由于符号预测精度对于较大的变换系数级别较高,因此VVC标准编码器和VVC标准解码器基于对应的Qldx值而不是残差系数级别值来对一维数组中的TB的变换系数符号进行排序。使用残差符号预测方法来预测根据从最大到最小排序的对应Qldx值的前n个符号,并且通过EPbin来用信号通知其余符号。符号预测区域也被扩展,不限于变换块内的左上4×4区域,而是扩展到大小高达32×32的区域;VVC标准编码器在块的语法结构中将区域的最大尺寸用信号通知给VVC标准解码器。
-
公开(公告)号:CN113744236B
公开(公告)日:2024-05-24
申请号:CN202111007119.8
申请日:2021-08-30
申请人: 阿里巴巴达摩院(杭州)科技有限公司
IPC分类号: G06T7/00
摘要: 本申请实施例提供一种回环检测方法、装置、存储介质及计算机程序产品,其中,回环检测方法包括:获取待检测数据帧,待检测数据帧中至少包括:单帧点云数据或单帧图像数据中的点数据;基于待检测数据帧的描述子在预设范围内确定与待检测数据帧匹配的目标数据帧;基于匹配网络确定待检测数据帧与目标数据帧之间的变换矩阵;利用变换矩阵对待检测数据帧进行变换,将目标数据帧与变换后的待检测数据帧输入置信度校验网络,得到置信度校验结果。利用神经网络模型确定变换矩阵,并进行置信度校验,能够通过数据驱动的方式实现回环检测,没有依赖几何规则,提高了对不同场景的适配能力,提高了回环检测的准确性。
-
公开(公告)号:CN118036683A
公开(公告)日:2024-05-14
申请号:CN202311697001.1
申请日:2023-12-11
申请人: 阿里巴巴达摩院(杭州)科技有限公司
摘要: 本说明书实施例提供数据处理方法及激活处理器,其中所述数据处理方法包括:接收针对初始业务特征数据的激活指令,其中,所述初始业务特征数据由目标神经网络层中的神经网络模块确定,所述目标神经网络层为各神经网络层中的任一个;响应于激活指令,获取所述初始业务特征数据;确定目标神经网络层对应的线性激活函数集合,其中,所述线性激活函数集合中包括目标神经网络层中预设非线性激活函数对应的至少两个线性激活函数;基于所述线性激活函数集合处理所述初始业务特征数据,生成目标业务特征数据。通过使用线性激活函数集合对神经网路输出的特征进行激活降低部署神经网络模型时硬件实现的资源消耗。
-
公开(公告)号:CN117115220B
公开(公告)日:2024-04-26
申请号:CN202311121899.8
申请日:2023-08-31
申请人: 阿里巴巴达摩院(杭州)科技有限公司
IPC分类号: G06T7/33 , G06T5/70 , G06V10/74 , G06V10/774
摘要: 本发明实施例提供一种图像处理方法、服务提供方法、装置、设备和存储介质,该方法包括:获取参考图像以及待配准图像,二者包含在不同拍摄条件下对相同对象拍得的图像。接着,获取参考图像的参考特征图,该特征图中包含参考图像中各信息单元的语义信息。根据参考特征图中的语义信息确定待配准图像的变换模型,并按照此变换模型对待配准图像进行配准以得到配准后图像。相比于利用图像的强度信息或外观信息确定变换模型,上述方法可以利用信息单元的语义信息确定变换模型,使得变换模型更加准确即可以使待配准图像更合理的进行变形,从而提高图像配准的准确性。
-
公开(公告)号:CN115804095B
公开(公告)日:2024-04-16
申请号:CN202180048660.5
申请日:2021-08-20
申请人: 阿里巴巴达摩院(杭州)科技有限公司
摘要: 本公开提供了用于视频或图像编码的帧内预测方法。一种示例性方法包括:对目标块执行帧内预测处理,其中执行帧内预测处理包括:确定目标块的帧内预测模式;响应于帧内预测模式是角度模式,基于角度模式通过将N抽头内插滤波器应用于目标块周围的多个参考采样来确定滤波值,其中N是大于4的整数;以及基于滤波值来确定目标块的采样的预测值。
-
-
-
-
-
-
-
-
-