一种基于自适应分块与概率重分配的图像分割方法

    公开(公告)号:CN118628734A

    公开(公告)日:2024-09-10

    申请号:CN202410663602.9

    申请日:2024-05-27

    Abstract: 本发明提出一种基于自适应分块与概率重分配的图像分割方法,属于图像分割技术领域。包括:S1.初始化高斯混合模型参数与每个像素的分割类别初始估计值;S2.对待分割图像使用固定形状的滑动窗口进行固定分块划分;S3.将待分割图像转换为灰度图像,计算每个像素邻域范围内的方差,生成每个像素的匹配度向量,选取匹配度向量中最小值的区域块与对应像素建立映射关系和像素‑块区域似然矩阵;S4、得到待分割图像的后验概率及本轮图像分割结果;S5.将待分割图像的后验概率按照像素与区域块的映射关系分配到区域块中的每个像素,对模型参数进行更新;S6.重复S2至S5,直至收敛。本发明有效提升整体分割的准确度和一致性。

    基于正向激励的自适应加速聚类联邦学习方法、计算机及存储介质

    公开(公告)号:CN117172334A

    公开(公告)日:2023-12-05

    申请号:CN202311141776.0

    申请日:2023-09-05

    Abstract: 本发明提出了一种基于正向激励的自适应加速聚类联邦学习方法,计算机及存储介质,属于人工智能领域。首先,计算客户端本地更新的余弦相似度,基于相似度大小实现客户端的有序化。接着,解释联邦学习客户端的正向激励机制;然后,提出了基于有序客户端序列和正向激励机制的聚类方法,沿着有序客户端序列通过正向激励机制依次确认所有类簇成员的身份。本发明基于有序客户端序列和正向激励机制的自适应加速聚类联邦学习算法(ACFL)不仅仅缓解了客户端数据异质性挑战导致的联邦模型性能较差的问题,并且降低了客户端的计算复杂度,加速了算法的的收敛速度,具有极高的实际应用价值。

    一种自适应维度选择的梯度压缩方法

    公开(公告)号:CN117172310A

    公开(公告)日:2023-12-05

    申请号:CN202311141747.4

    申请日:2023-09-05

    Abstract: 本发明提供一种自适应维度选择的梯度压缩方法,用于解决在分布式训练时传输梯度造成的通信开销问题,应用梯度稀疏化方法来对梯度向量进行压缩。本发明包括:基于累积加权梯度的活性维度选取,通过给本轮梯度加权提高其在全局梯度中比重,自适应地发送满足条件的本轮中最为重要的梯度维度。

    一种基于改进型EmbedKGQA模型的知识图谱问答方法、电子设备及存储介质

    公开(公告)号:CN114936293B

    公开(公告)日:2023-01-31

    申请号:CN202210646432.4

    申请日:2022-06-08

    Abstract: 本发明提出一种基于改进型EmbedKGQA模型的知识图谱问答方法、电子设备及存储介质,属于机器学习技术领域。首先,获得问题集、问题的主题实体、问题的答案集和答案相关的关系集;其次,得到知识图谱中所有实体和关系的嵌入表示;其次,将自然语言问题嵌入到固定的维度;其次,得到增强的问题嵌入表示;其次,将增强的问题嵌入表示、主题实体嵌入表示通过答案评分函数得到所有实体的答案得分和答案候选实体的嵌入表示;最后,将候选实体嵌入表示信息通过关系评分函数,将答案评分函数和关系评分函数的线性组合作为最终的评分函数,选择得分最高的实体作为预测结果。解决EmbedKGQA模型效率低、问答不准确的问题。

    一种基于Unet模型的肺实质图像分割方法

    公开(公告)号:CN115115661A

    公开(公告)日:2022-09-27

    申请号:CN202210957913.7

    申请日:2022-08-10

    Abstract: 本发明提供一种基于Unet模型的肺实质图像分割方法,解决了基于深度学习的肺实质分割模型复杂度高、运算量大和参数多的问题,属于医学图像处理领域。本发明包括:获取待分割的肺实质CT图像;图像预处理;建立LUnet网络结构:以原始Unet模型为基础,使用预激活的残差模块替代编码路径中原有的卷积模块,并在编码路径和解码路径中间引入多尺度上下文模块,同时减少网络层数和调整每层的通道数;利用预处理好的肺实质CT图像对LUnet网络进行训练;将待分割的肺实质CT图像测试集输入训练好的LUnet网络获取分割结果。实验结果表明本发明相较于其它经典语义分割模型,具有参数少、运算量小和精确度高等优点,实现了肺实质图像的快速分割。

    基于多模态渐进式注意力模型解决视频问答任务的方法

    公开(公告)号:CN113688296B

    公开(公告)日:2022-05-31

    申请号:CN202110915934.8

    申请日:2021-08-10

    Abstract: 本发明的实施方式提供了一种基于多模态渐进式注意力模型解决视频问答任务的方法。该方法包括:一、针对视频问答任务中的多种模态信息,分别提取多种模态特征;二、利用问题对提取到的多种模态特征进行初步关注并计算相应的权重得分,再利用问题对重要模态特征进行迭代关注以定位到与问题最相关的模态特征;三、利用多模态融合算法实现特征的跨模态融合,再利用问题对视频的多模态融合表示进行关注,找出与问题相关的重要视频特征;四、将模型的部分有效输出结果进行融合,用于答案生成。相比现有的视频问答解决方案,本发明能够更精准地定位到与问题相关的视频帧或视频画面区域。本发明在视频问答任务中取得的效果相比于传统的方法更好。

    一种缩短时间戳网络解决多事件视频问答系统、方法、计算机及存储介质

    公开(公告)号:CN113590879B

    公开(公告)日:2022-05-31

    申请号:CN202110896068.2

    申请日:2021-08-05

    Abstract: 本发明提出一种缩短时间戳网络解决多事件视频问答系统、方法、计算机及存储介质,属于计算机视觉和自然语言处理交叉领域。将视频和字幕提取为多级的事件嵌入,并提取问题和候选答案的特征。利用问题导向的注意力获取不同事件的注意力权重,并利用模糊理论中的截距阵提取视频中的关键事件嵌入。利用问题和答案分别关注不同模态的关键事件嵌入,生成具有问题导向和具有答案导向的上下文信息。自适应地融合问题导向和答案导向的上下文,生成答案。相比于一般视频问答方案,本发明从视频中提取多个事件的多模态嵌入,并利用模糊数学中的截距阵等理论筛选出关键事件,通过去除冗余信息提高了回答的准确性。本发明在视频问答中的效果比于传统方法更好。

    基于原型网络和自编码器的小样本图像分类系统

    公开(公告)号:CN113610151B

    公开(公告)日:2022-05-03

    申请号:CN202110896795.9

    申请日:2021-08-05

    Abstract: 本申请公开了一种基于原型网络的自编码器网络机制解决小样本图像分类的系统、方法、设备及存储介质,属于计算机视觉技术领域。解决了现有技术中无法同时利用样本类内与类间分布情况的不足。本申请1)针对于输入的基类数据集,训练一个基于映射学习的原型网络和编码神经网络,学习出基类的类原型表征,并计算类内样本与类原型表征的距离。2)对于编码后得到的类内样本的相对分布信息,再与类原型表征一起训练出解码神经网络,用来针对于支持集样本与类原型表征的相对分布信息输出一定数量的重构样本。3)将重构样本与支持集样本一起训练一个分类器,以提高小样本图像分类的准确率。本申请提高了分类器的性能和泛化能力。

    一种新的使用扩展控制流图的反汇编方法

    公开(公告)号:CN113918171A

    公开(公告)日:2022-01-11

    申请号:CN202111217152.3

    申请日:2021-10-19

    Inventor: 董沣 邱景 孙广路

    Abstract: 本发明提出了一种可执行文件反汇编方法,可以对于任意字节序列进行反汇编。所述方法包括如下步骤:步骤1:建立字节序列从每一个字节为起始地址的反汇编结果集合;步骤2:将反汇编结果按照控制流构建扩展控制流图;步骤3:删除部分非法的控制流图;步骤4:使用图注意力神经网络对扩展控制流图节点进行分类。与传统方法不同,本方法构建字节序列包含所有可能反汇编结果的扩展控制流图,并使用深度学习方法判别正确的反汇编结果。可以有效的处理传统方法无法识别的无任何附加信息的任意一段二进制序列,并且完成字节序列反汇编,代码和数据的区分以及函数识别。

    基于多模态渐进式注意力模型解决视频问答任务的方法

    公开(公告)号:CN113688296A

    公开(公告)日:2021-11-23

    申请号:CN202110915934.8

    申请日:2021-08-10

    Abstract: 本发明的实施方式提供了一种基于多模态渐进式注意力模型解决视频问答任务的方法。该方法包括:一、针对视频问答任务中的多种模态信息,分别提取多种模态特征;二、利用问题对提取到的多种模态特征进行初步关注并计算相应的权重得分,再利用问题对重要模态特征进行迭代关注以定位到与问题最相关的模态特征;三、利用多模态融合算法实现特征的跨模态融合,再利用问题对视频的多模态融合表示进行关注,找出与问题相关的重要视频特征;四、将模型的部分有效输出结果进行融合,用于答案生成。相比现有的视频问答解决方案,本发明能够更精准地定位到与问题相关的视频帧或视频画面区域。本发明在视频问答任务中取得的效果相比于传统的方法更好。

Patent Agency Ranking