多语言文本检测识别系统
    81.
    发明公开

    公开(公告)号:CN109948615A

    公开(公告)日:2019-06-28

    申请号:CN201910232853.0

    申请日:2019-03-26

    Abstract: 本发明公开了一种多语言文本检测识别系统,包括:文本检测器,用于在输入图像中生成一系列的文本候选框;归一化单元,用于在每一文本候选框在保存原有宽高比的基础上将所有文本候选框调整为统一高度;脚本识别网络,用于对归一化后的文本候选框中文本的类型进行识别,确定相应文本为符号或者某个具体的语言类型;基于注意力机制的多语言文本识别网络,用于对归一化后的文本候选框中文本内容进行识别。该系统可以同时检测并识别出场景文本图像中的多种语言的文本。

    髋关节X光图像自动分析方法

    公开(公告)号:CN109567839A

    公开(公告)日:2019-04-05

    申请号:CN201811389123.3

    申请日:2018-11-20

    Abstract: 本发明公开了一种髋关节X光图像自动分析方法,包括:获取预先进行了S个关键点位置标注的髋关节X光图像;对于预先收集的一系列髋关节X光图像,在标注的每一个关键点上分别取一张切片图像,所得到的每一切片图像即为初步模板,从而构成一个初步模板库,则对于S个关键点共有S个初始模板库;分别对每一个初始模板库中的初步模板采用模板匹配的方法求取相似度,最终选取出多个模板,构成能够用于查找一个关键点的有序模板库,则对于S个关键点共有S个有序模板库;对于待分析的髋关节X光图像,通过模板匹配与聚类的方式结合每一有序模板库实现每一关键点的分析查找。该方法可以自动的、准确的实现髋关节X光图像分析。

    髋关节X光图像快速自动分析方法

    公开(公告)号:CN109544536A

    公开(公告)日:2019-03-29

    申请号:CN201811421818.5

    申请日:2018-11-26

    Abstract: 本发明公开了一种髋关节X光图像快速自动分析方法,包括:获取预先进行了关键点位置标注的髋关节X光图像;对于预先收集的一系列髋关节X光图像,根据标注的关键点位置制作深度学习数据集,其中包含了训练集与测试集;构建了一个基于2D神经网络的回归系统,回归系统根据输入的髋关节X光图像预测各个关键点的坐标值,利用训练集对回归系统进行训练,并利用测试集对于训练后的回归系统进行测试;对于待分析的髋关节X光图像,将其输入至通过测试的回归系统,得到各个关键点的坐标值。该方法可以快速的、准确的实现髋关节X光图像自动分析。

    基于深度学习的视网膜OCT图像分类方法

    公开(公告)号:CN109376767A

    公开(公告)日:2019-02-22

    申请号:CN201811103949.9

    申请日:2018-09-20

    Abstract: 本发明公开了一种基于深度学习的视网膜OCT图像分类方法,包括:构建卷积神经网络,其包含多个Inception段,每一个Inception段内包含若干Inception模块,且特定序号的Inception段外还插入了残差注意力模型,最后一个Inception段后端还依次设有全局平均池化层与softmax层;利用包含正常视网膜OCT图像与非正常视网膜OCT图像的训练集对所述卷积神经网络进行训练;利用训练好的卷积神经网络对新输入的视网膜OCT图像进行分类,获得分类结果。该方法可以自动实现视网膜OCT图像的准确分类。

    一种基于卷积注意力网络的自然场景文本识别方法

    公开(公告)号:CN108615036A

    公开(公告)日:2018-10-02

    申请号:CN201810437763.0

    申请日:2018-05-09

    Inventor: 谢洪涛 张勇东

    Abstract: 本发明公开了一种基于卷积注意力网络的自然场景文本识别方法,包括:利用二维卷积CNN作为编码器,提取输入图像的高层语义特征,并输出相应的特征图至解码器;利用一维卷积CNN作为解码器,结合注意力机制来整合编码器生成的高层语义特征与字符级语言模型,产生对应于输入图像的解码字符序列。该方法对于长度为n的序列,使用卷积核为s的CNN建模字符序列,仅需O(n/s)次操作即可得到长期依赖的表达,极大的降低了算法复杂度;此外,由于卷积操作的特征,CNN相比于RNN能够更好并行化,从而发挥GPU等资源的优势,更重要的是,通过叠加卷积层的方式得到的深层模型,可以提高更高层次的抽象表达,从而提高模型的准确率。

    开放词汇图像语义分割方法、系统、设备及存储介质

    公开(公告)号:CN119723096B

    公开(公告)日:2025-05-13

    申请号:CN202510227653.1

    申请日:2025-02-27

    Abstract: 本发明公开了一种开放词汇图像语义分割方法、系统、设备及存储介质,它们是一一对应的方案,相关方案与传统的方法不同,不仅能够生成准确且多样的识别结果,涵盖了属性和多层次语义信息,并且,通过视觉到语言的学习,具有更强的泛化能力,能够更灵活地处理不同的视觉内容,并能够有效识别开放场景中的目标;通过实验结果表明,本发明的方案可以在多个数据集上提升开放词汇图像语义分割性能,此外,本发明的方案也具有高可扩展性,其有潜力作为一个自动化系统,用于自动化的标注。

    视频理解大模型优化与评估方法、系统、设备及存储介质

    公开(公告)号:CN119888581A

    公开(公告)日:2025-04-25

    申请号:CN202510349413.9

    申请日:2025-03-24

    Abstract: 本发明公开了一种视频理解大模型优化与评估方法、系统、设备及存储介质,它们还是一一对应的方案,方案中:设计了新的连接器结构以提升全局时序理解能力,其包含时空下采样器,局部双向Mamba结构以及线性层组成。时空下采样器能够降低令牌存储开销;同时,局部双向Mamba结构,一方面弥补了感受野受限的问题,另一方面其能够同时建模帧内特征和帧间特征;此外,该连接器的训练是低成本的,并且使用了三阶段的渐进式训练策略,可以对抗灾难性遗忘;并且,还构建了半自动化数据生成管道并基于此管道提出了全局时序理解数据,以弥补现有基准领域在该能力上的评估空缺。

    基于联邦学习的漏洞可利用性评估方法及其装置

    公开(公告)号:CN119377959A

    公开(公告)日:2025-01-28

    申请号:CN202310927773.3

    申请日:2023-07-25

    Abstract: 本公开提供了一种基于联邦学习的漏洞可利用性评估方法及其装置,该方法包括:获取待评估漏洞信息,其中,待评估漏洞信息包括漏洞文本信息和漏洞非文本信息;基于待评估漏洞信息,提取漏洞文本特征信息和漏洞非文本特征信息;将漏洞文本特征信息和漏洞非文本特征信息进行融合,得到融合特征信息;以及将融合特征信息输入漏洞可利用性评估模型,输出评估结果,其中,评估结果用于表征待评估漏洞信息的可利用性,漏洞可利用性评估模型是基于联邦学习,对分类模型进行训练得到的。

Patent Agency Ranking