一种多模态哈希检索方法及装置

    公开(公告)号:CN115982403B

    公开(公告)日:2024-02-02

    申请号:CN202310085564.9

    申请日:2023-01-12

    Abstract: 本发明公开了一种多模态哈希检索方法及装置,该方法包括:获取带有标签的训练数据集;构建带有Transformer Encoder模块的多模态神经网络;根据所述训练数据集中的每个多模态数据经过所述多模态神经网络生成的哈希码与该多模态数据对应的标签,设计目标损失函数;根据所述目标损失函数,采用梯度下降法更新所述多模态神经网络的参数,以训练所述多模态神经网络;获取多模态原始数据并对所述多模态原始数据进行特征工程加工;将加工后的多模态原始数据输入训练后的多模态神经网络中,生成多模态哈希码;利用所述多模态哈希码,进行哈希检索。该方法使用Transformer网络实现多模态特征融合,与单模态哈希表示学习相比,检索的平均准确率(mAP)更高。

    面向芯粒互连焊点的界面金属间化合物电阻率测量方法

    公开(公告)号:CN117388319A

    公开(公告)日:2024-01-12

    申请号:CN202311272984.4

    申请日:2023-09-27

    Abstract: 本发明公开了一种面向芯粒互连焊点的界面金属间化合物电阻率测量方法,首先在基板表面依次形成阻挡层、金属种子层、第一金属层和第二金属层;随后低温回流引发原位冶金反应,然后通过固相热处理推进金属间化合物平坦化生长,并通过电解抛光去除未反应的第二金属层,得到面向芯粒互连焊点的界面金属间化合物;最后通过四探针法测试依附于基板的可测试性的面向芯粒互连焊点的界面金属间化合物的电阻率。本发明技术可制备层厚可控、成分准确、高表面平整度、高致密度的可测试性界面金属间化合物,为芯粒互连焊点界面金属间化合物电阻率测量提供了一条可行路径,其实现方法简单,技术灵活,具有普适性。

    基于GPU的任务调度方法、电子装置和存储介质

    公开(公告)号:CN117032937B

    公开(公告)日:2024-01-09

    申请号:CN202311271781.3

    申请日:2023-09-28

    Abstract: 本申请涉及一种基于GPU的任务调度方法、电子装置和存储介质,其中,该任务调度方法包括:统计预设运行时间内调度器的GPU执行新任务时计算资源使用率超过计算资源平均使用率的时间占比和显存占用率超过显存平均占用率的时间占比;获取性能拐点显存占用率;据此划分新任务的类型并根据该类型和各执行器的GPU的运行任务数据,将新任务调度至匹配的执行器;执行前基于GPU运行状态、显存占用情况、新任务及正运行的任务的性能拐点显存占用率,分配GPU资源。通过本申请,解决了不具备优先级信息时GPU资源利用率低的问题,实现了在不具备任务优先级信息的情况下提高GPU资源利用率。(56)对比文件汤小春;符莹;樊雪枫.数据中心上异构资源的细粒度分配算法研究.西北工业大学学报.2020,(第03期),全文.

    一种深度学习编译器的图优化序列生成方法及装置

    公开(公告)号:CN116991388B

    公开(公告)日:2024-01-09

    申请号:CN202311252630.3

    申请日:2023-09-26

    Abstract: 本申请公开了一种深度学习编译器的图优化序列生成方法及装置,通过预先训练完成的序列生成模型,根据目标模型的图中间表示,确定各优化策略分别对应的优化特征,再通过序列生成模型的解码器,确定各排位分别对应的排位特征,进而基于各排位特征和各优化特征之间的相关度,确定各排位分别对应的优化策略,以此来确定目标序列。本申请可根据各优化策略确定出各排位分别对应的排位特征,以此来确定出各排位分别匹配的优化策略,使得确定出的目标序列中包含的优化策略与其对应的排位互相匹配,进而保证基于该目标序列优化得到的目标模型的业务执行效率。

    一种算子调用代码自动生成的方法、装置、介质及设备

    公开(公告)号:CN116932092B

    公开(公告)日:2024-01-09

    申请号:CN202311202669.4

    申请日:2023-09-18

    Abstract: 本说明书公开了一种算子调用代码自动生成的方法、装置、介质及设备。所述方法包括:获取后端硬件平台对应的算子库基本信息以及目标深度学习算法的计算图;根据算子库基本信息生成算子调用代码的代码头;对计算图进行解析,确定计算图中的各前端算子;针对每个前端算子,根据该前端算子与算子调用模板之间的映射关系,确定该算子对应算子调用模板的声明语句以及模板函数的调用语句;根据代码头、声明语句、调用语句以及该算子对应的配置信息,生成完整的后端算子的调用代码;根据每个后端算子的调用代码调用各后端算子,以通过各后端算子执行计算任务。(56)对比文件丁然;林建文;朱振华;刘弋波.一种类CPU的深度学习协处理器架构.中国集成电路.2020,(第Z4期),全文.王秉睿;兰慧盈;陈云霁.深度学习编程框架.大数据.2018,(第04期),全文.傅鹂;鲁先志;蔡斌.一种基于数据流驱动的数据流连续查询模型.重庆工学院学报(自然科学版).2008,(第10期),全文.

    一种高性能算子选择的动态决策方法及装置

    公开(公告)号:CN117171577A

    公开(公告)日:2023-12-05

    申请号:CN202311450171.X

    申请日:2023-11-02

    Abstract: 本说明书公开了一种高性能算子选择的动态决策方法及装置,包括:在选择模型中特定算子应该由算子库中具体的哪一个算子实现时,需要定位到模型中特定算子的shape特征的特征区间下,并确定该特征区间下的性能排序子表是否被更新过,若是,则可以直接通过该特征区间下更新好的性能排序子表选取出目标算子,若还未更新,则在模型训练阶段可以在每一轮训练时选取不同的算子在模型中进行训练,从而得到算子的性能分数,对性能排序子表进行更新,那么在后续训练这个模型(或者其他模型中需要相同特征区间下的shape特征的算子)时,可以直接使用该性能排序子表选取出合适的算子,从而相比于现有技术能够更加准确的选择出性能良好的算子。

    一种生成存内计算神经网络模型的方法、装置及介质

    公开(公告)号:CN117077726A

    公开(公告)日:2023-11-17

    申请号:CN202311344094.X

    申请日:2023-10-17

    Abstract: 本申请公开了一种生成存内计算神经网络模型的方法,首先根据待构建的神经网络模型的目标任务,根据历史执行所述目标任务的任务数据作为训练样本,以及将目标任务的执行结果作为标注,之后通过对量化可微超网络的模型结构进行初始化,确定模型各节点之间数据传递顺序的有向无环图,确定架构参数以及权重参数,依该有向无环图的顺序,通过训练样本对权重参数进行调整,然后通过调整后的权重参数配置的模型,调整架构参数,得到存内运行的神经网络模型。通过权值继承,实现了可交替优化的两种参数,分别通过有监督训练和启发式学习进行调整,使得可以更为高效的学习深度神经网络架构。

    一种量化感知训练的点云目标检测方法及装置

    公开(公告)号:CN116721399B

    公开(公告)日:2023-11-14

    申请号:CN202310925867.7

    申请日:2023-07-26

    Abstract: 本说明书公开了一种量化感知训练的点云目标检测方法及装置,可以获取训练样本,将训练样本中的点云样本数据输入到全精度网络中,得到目标检测结果,以对全精度网络进行训练,得到训练后的全精度网络,而后,将训练后的全精度网络进行模型量化,得到量化后网络,量化后网络的参数精度低于全精度网络的参数精度,而后,将训练样本输入到量化后网络中,得到量化后网络得到的目标检测结果,根据标注信息和目标检测结果,对量化后网络进行参数微调训练,得到训练后的量化后网络,最后,将训练后的量化后网络部署在无人驾驶设备中,以使无人驾驶设备通过量化后网络进行点云目标检测,从而在保证准确性的情况下提高了无人驾驶设备的点云检测效率。

    基于GPU的任务调度方法、电子装置和存储介质

    公开(公告)号:CN117032937A

    公开(公告)日:2023-11-10

    申请号:CN202311271781.3

    申请日:2023-09-28

    Abstract: 本申请涉及一种基于GPU的任务调度方法、电子装置和存储介质,其中,该任务调度方法包括:统计预设运行时间内调度器的GPU执行新任务时计算资源使用率超过计算资源平均使用率的时间占比和显存占用率超过显存平均占用率的时间占比;获取性能拐点显存占用率;据此划分新任务的类型并根据该类型和各执行器的GPU的运行任务数据,将新任务调度至匹配的执行器;执行前基于GPU运行状态、显存占用情况、新任务及正运行的任务的性能拐点显存占用率,分配GPU资源。通过本申请,解决了不具备优先级信息时GPU资源利用率低的问题,实现了在不具备任务优先级信息的情况下提高GPU资源利用率。

    基于聚类描述的小样本实体识别方法、装置和计算机设备

    公开(公告)号:CN116757216B

    公开(公告)日:2023-11-07

    申请号:CN202311024641.6

    申请日:2023-08-15

    Abstract: 本申请涉及一种基于聚类描述的小样本实体识别方法、装置和计算机设备,通过获取待识别文本数据;将所述待识别文本数据输入实体边界定位模型,得到所述待识别文本数据中所有实体的实体边界;将所述待识别文本数据以及所述实体边界输入实体聚类模型,得到多个类别的实体;基于多个类别的所述实体,确定每个类别的类别标识以及对应实体。上述基于聚类描述的小样本实体识别方法,基于实体边界定位模型和实体聚类模型,能够精准识别实体边界,并对实体进行精准分类,明显提高了实体识别和分类效率,并且由于人工介入的减少,也会一定程度提高实体标记的准确性。

Patent Agency Ranking