基于图像和文本语义相似度的图像语义消歧方法和装置

    公开(公告)号:CN108647705A

    公开(公告)日:2018-10-12

    申请号:CN201810368937.2

    申请日:2018-04-23

    Abstract: 本发明提供了一种基于图像和文本语义相似度的图像语义消歧方法和装置。该方法包括:将一个多义词的一个意思用一个均值向量表示,使用图像显著性标签对待处理图像进行标注,得到待处理图像的标签,将待处理图像的标签和图像内容转换成向量的形式,得到待处理图像的融合向量;使用余弦相似度分别计算出待处理图像的融合向量与每个均值向量之间的相似度,找出相似度最大的均值向量,将该相似性最高的均值向量对应的意思确定为待处理图像的正确解释。本发明采用图像、文本结合的方法,将图像转换为向量,解决了图像翻译和图像查询歧义的问题,并开创性地实现了有效消除图像歧义性。大大提高了图像查询和解释的准确性,降低了图像解释的错误率。

    一种基于词向量分析的网络文章所属事件的检测方法和装置

    公开(公告)号:CN105975478A

    公开(公告)日:2016-09-28

    申请号:CN201610218382.4

    申请日:2016-04-09

    Abstract: 本发明实施例提供了一种基于词向量分析的网络文章所属事件的检测方法和装置。该方法主要包括:建立典型训练集;对典型训练集中的每一条网络文章样本进行分词,去无用词预处理,得到规范化的网络文章样本文本;将每一条规范化的网络文章样本文本分别用word2vec算法和LDA算法提取特征,得到每一条网络文章样本文对应的多维词向量;将每一条网络文章样本文本对应的多维词向量和事件标签输入到随机森林算法,该随机森林算法输出事件的分类模型,利用所述事件的分类模型对待识别的网络文章文本进行识别,判断出所述待识别的网络文章文本所属的事件。本发明实施例充分利用了网络文本样本的信息,提高了网络文本样本所属事件分类的准确度。

    一种图像物体大小恒常性计算方法

    公开(公告)号:CN1945629A

    公开(公告)日:2007-04-11

    申请号:CN200610113910.6

    申请日:2006-10-20

    Abstract: 本发明公开了一种图像物体大小恒常性的计算方法,属于计算机视觉、图像理解与模式识别的技术领域。知觉恒常性是人类感知世界最重要、最突出的方面。大小恒常性是最重要的知觉恒常性之一。本发明能使计算机像人一样,对单幅二维图像中的各物体能实现大小恒常性感知,因为该方法完全模拟了人类视觉系统大小恒常性的机制。它的主要步骤包括:用天空检测技术计算出图像中间线;在图像地面部分计算出从图像底端边线到中间线的深度变化最快方向直线参数;计算各图像物体中点处感知深度;计算各图像物体的恒常性大小。本发明特别有助于解决物体识别中的视点不变难题,可用于图像物体的识别。

    基于人体拓扑结构对齐的多人姿态估计方法

    公开(公告)号:CN112801138B

    公开(公告)日:2024-04-09

    申请号:CN202110009492.0

    申请日:2021-01-05

    Abstract: 本发明提供了一种基于人体拓扑结构对齐的多人姿态估计方法。该方法包括:用MS‑COCO和MPLL数据集为输入训练HRNet网络,得到XZZNet网络;利用HRNet网络对数据集的图像样本进行学习得到人体关键点图像;将SZF数据集输入到XZZNet网络中,生成候选的没有袖子的人体姿态关键点;对HRNet网络生成的人体关键点图和XZZNet生成的候选的人体关键点图进行图匹配,利用交叉熵损失函数微调XZZNet网络,得到优化的XZZNet网络;将SZF数据集输入到优化的XZZNet网络中,生成SZF数据集中的图像对应的关键点检测图像,根据关键点检测图像得到图像中包含人体的各个关键点姿态信息。本发明在没有标记或者稀疏标记的图像中可以显著提高目标域的性能,在无监督网络学习框架下可以准确地区分图像中人体的各个关键点。

    基于子空间表示和全局消歧方法的偏标记学习方法

    公开(公告)号:CN111581467B

    公开(公告)日:2024-04-02

    申请号:CN202010411587.0

    申请日:2020-05-15

    Abstract: 本发明提供了一种基于子空间表示和全局消歧方法的偏标记学习方法。该方法包括:构建特征矩阵和候选标记矩阵;基于构建特征矩阵和候选标记矩阵,构建特征子空间学习模型和标记全局消歧模型;综合特征子空间学习模型和标记全局消歧模型得到混合模型,采用交替优化方法求解混合模型,得到多分类模型、映射矩阵和偏标记置信度矩阵;根据多分类模型和映射矩阵对未见示例进行分类,计算出未见示例的多个标记值,将预测置信度最高的标记值对应的标记确定为未见示例所属的标记类别。本发明可同时利用特征子空间表示法和标记全局消歧方法,同时从特征和标记两方面解决偏标记学习问题,所获特征具有更强表征能力;生成的标记置信度矩阵有更好的消歧效果。

    一种基于节点贡献聚类的公平联邦学习方法

    公开(公告)号:CN117196058A

    公开(公告)日:2023-12-08

    申请号:CN202310485711.1

    申请日:2023-04-28

    Abstract: 本发明提供的一种基于节点贡献聚类的公平联邦学习方法,首先根据联邦学习中每个客户端的实际贡献程度进行分组,并将贡献相似的客户端划分为同一组。在每一轮迭代中,首先在每个组的客户端之间进行组内聚合,然后将组内聚合获得的小组模型更新参数上传到服务器端,服务器端对不同组之间的模型进行全局聚合。经过一段时间的全局聚合,每个组基本可以获得其他组的训练信息。此时,可以将全局联邦学习过程划分为组,每个组可以训练自己的个性化组模型,使每个组都能获得与其自身贡献相匹配的公平回报。

    基于弱监督学习的人体图像解析方法及系统

    公开(公告)号:CN116912878A

    公开(公告)日:2023-10-20

    申请号:CN202310635998.1

    申请日:2023-06-01

    Abstract: 本发明提供一种基于弱监督学习的人体图像解析方法及系统,属于计算机视觉及人工智能技术领域,获取数据并预处理后,提取图片中的低层次视觉特征和高层次语义特征;在人体解析分支中,方法将基础网络输出的高层次的语义特征作为该分支的输入来获取预测的人体解析结果。在边缘分支中,方法将基础网络输出的低层次的视觉特征作为该分支的输入来获取边缘检测图。方法对两个分支的任务进行多任务联合学习和训练。本发明通过使用人体解析结果进一步对粗糙的边缘伪标签进行细化,以提供给边缘分支更加可靠的监督信息,并通过交叉注意力机制更充分地融合了人体解析结果和边缘信息,从而获得了更加精细的人体解析结果,提高了弱监督人体解析模型的精准率。

    基于图卷积神经网络的车辆重识别方法

    公开(公告)号:CN112396027B

    公开(公告)日:2023-09-19

    申请号:CN202011384258.8

    申请日:2020-12-01

    Abstract: 本发明提供了一种基于图卷积神经网络的车辆重识别方法。包括:构建用于车辆重识别的网络模型,使用卷积神经网络提取待重识别的车辆图像的全局和局部特征,利用图卷积神经网络得到结构化特征,利用结构化特征计算网络模型的损失函数;根据损失函数训练网络模型,将待重识别的车辆图像和测试集的所有图像输入到训练好的网络模型中,分别得到待测图片和测试集的所有图像的图片特征,根据图片特征计算出待测图片和测试集的各个图像之间的相似性,根据相似性得到待重识别的车辆图像的重识别结果。本发明通过使用图卷积神经网络挖掘局部特征与局部特征、局部特征与全局特征之间的结构化信息,从而获得更优更全面的特征表达,提高了车辆重识别的精度。

    基于端边云协同的列车群分布式控制系统及方法

    公开(公告)号:CN116001871A

    公开(公告)日:2023-04-25

    申请号:CN202211674118.3

    申请日:2022-12-26

    Abstract: 本发明提供一种基于端边云协同的列车群分布式控制系统及方法,属于列车运行控制技术领域,包括:云端服务器、云端列车规划调度中心、边缘端决策服务器和终端列车信息采集设备;云端列车规划调度中心与云端服务器、边缘端决策服务器、终端列车信息采集设备连接。本发明实现了分布式列车群调度,减少调度中心通信资源消耗;减少了云端调度中心的计算决策负载,提升了列车群控制决策的实时性和可靠性。

Patent Agency Ranking