-
公开(公告)号:CN110674328A
公开(公告)日:2020-01-10
申请号:CN201910925718.4
申请日:2019-09-27
Applicant: 长城计算机软件与系统有限公司
Abstract: 本发明涉及一种商标图像检索方法、系统、介质及设备,该方法包括:按照每个商标分类号的所有类似群号对包含商标图像的特征向量的特征库进行分库;按照确定的聚类中心的数量对每个所述分库中的商标图像的特征向量进行聚类,在每个所述分库中为属于同一个聚类簇的特征向量划分一个子库;根据待查询商标的分类号和商标图像确定所述待查询商标所属子库;计算所述待查询商标的商标图像的特征向量与所属子库中商标图像的特征向量之间的距离;输出距离最小的前N个商标图像的特征向量对应的商标作为检索结果。本发明可大幅减少线上检索时的搜索范围,尤其当向量维度较高时,可以显著提高检索效率。
-
公开(公告)号:CN106372051B
公开(公告)日:2019-05-03
申请号:CN201610916401.0
申请日:2016-10-20
Applicant: 长城计算机软件与系统有限公司
Abstract: 本发明涉及一种专利地图的可视化方法和系统,该方法包括:获取专利文献数据集中每个专利文献对应的多维文本向量;对每个专利文献对应的多维文本向量进行聚类分析,得到多个聚类结果;将每个聚类结果对应的多个专利文献映射到二维平面,以进行降维处理并得到专利文献数据点;将多个专利文献数据点进行可视化计算,生成可视化数据,并将可视化数据在二维平面上显示成三维图像。本发明提供的一种专利地图的可视化方法和系统,能够简化专利地图生成过程中的运算量,从而减少对对CPU和内存的开销,实现实时生成专利地图并展现。
-
公开(公告)号:CN110674881A
公开(公告)日:2020-01-10
申请号:CN201910925704.2
申请日:2019-09-27
Applicant: 长城计算机软件与系统有限公司
IPC: G06K9/62 , G06F16/535 , G06F16/53
Abstract: 本发明涉及一种商标图像检索模型训练方法,包括:获取多组样本数据,根据相似度为每个查询样本选择最难正例样本和多个困难负例样本;将一个查询样本、对应的最难正例样本和对应的多个困难负例样本作为一组训练数据,根据多组训练数据利用神经网络进行商标图像检索模型训练;根据多负例对比损失函数对商标图像检索模型进行更新,直至商标图像检索模型在验证集上的验证效果不再提升,则结束训练。本发明根据相似度剔除容易样本、挖掘难分样本,充分利用了少部分难分样本,更有针对性的对神经网络参数进行调整,可以较好地推迟模型收敛/过拟合,使训练更充分,效果更好。本发明还涉及商标图像检索模型训练系统、存储介质及计算机设备。
-
公开(公告)号:CN106372051B8
公开(公告)日:2019-06-18
申请号:CN201610916401.0
申请日:2016-10-20
Applicant: 长城计算机软件与系统有限公司
Abstract: 本发明涉及一种专利地图的可视化方法和系统,该方法包括:获取专利文献数据集中每个专利文献对应的多维文本向量;对每个专利文献对应的多维文本向量进行聚类分析,得到多个聚类结果;将每个聚类结果对应的多个专利文献映射到二维平面,以进行降维处理并得到专利文献数据点;将多个专利文献数据点进行可视化计算,生成可视化数据,并将可视化数据在二维平面上显示成三维图像。本发明提供的一种专利地图的可视化方法和系统,能够简化专利地图生成过程中的运算量,从而减少对对CPU和内存的开销,实现实时生成专利地图并展现。
-
公开(公告)号:CN107729445A
公开(公告)日:2018-02-23
申请号:CN201710918642.3
申请日:2017-09-30
Applicant: 长城计算机软件与系统有限公司
IPC: G06F17/30
Abstract: 本发明涉及一种基于HTML5的大文本阅读定位及显示方法,包括:根据用户输入的第一指令,确定文本的阅读模式;当阅读模式为用户自定义模式时,接收用户输入的第二指令,并根据第二指令为文本的阅读设置多组高亮显示规则;根据多组高亮显示规则,对文本的当前页面的内容进行关键词的高亮显示和批注提示;通过超文本标记语言(HTML5)和区域定位算法,生成文本的当前页面中关键词和批注的导航地图;根据用户输入的第三指令,在文本的当前页面中定位导航地图中的第一颜色对应的关键词的位置。本发明能够在大文本阅读时提供导航定位功能,通过导航地图查看关键词和批注在整个页面中的分布情况,方便定位查看,节省时间成本,提升用户体验。
-
公开(公告)号:CN112200117B
公开(公告)日:2023-10-13
申请号:CN202011139730.1
申请日:2020-10-22
Applicant: 长城计算机软件与系统有限公司
IPC: G06V30/413 , G06V30/148 , G06V10/82 , G06V30/18 , G06V30/162 , G06V30/16 , G06N3/045 , G06N3/044 , G06N3/0464 , G06N3/08 , G06F40/174 , G06T11/60
Abstract: 本发明公开了一种表格识别方法及装置,涉及表格识别技术领域。该方法包括:获取包含待识别表格的图片,对图片中的表格的轮廓进行检测,根据检测结果得到表格中每个单元格的相对坐标;通过卷积递归神经网络对每个单元格内的文字进行识别,如果识别失败,则通过渐进尺度扩展网络对识别失败的单元格内的文字进行识别;识别完成后,根据识别结果确定每个单元格的内容,根据每个单元格的相对坐标确定每个单元格的相对位置,生成表格文件。本发明不需要对样本数据进行字符分割,可识别任意长度的文本序列,模型速度快、性能好,并可以成功地识别相邻文本实例,从而提高识别的准确度和精确度。
-
公开(公告)号:CN112836010A
公开(公告)日:2021-05-25
申请号:CN202011141538.6
申请日:2020-10-22
Applicant: 长城计算机软件与系统有限公司
Abstract: 本发明公开了用于专利的检索方法、存储介质及装置,涉及计算机技术领域。该方法包括:根据预先建立的神经网络模型分别对待检索专利进行语义和表面信息的特征抽取,将得到的语义特征向量和表面信息特征向量进行拼接,得到融合特征向量;根据融合特征向量从预设的特征数据库中匹配相似度满足预设相似度条件的专利,得到检索结果。本发明适用于专利文件的相似文本的检索,能够得到准确的检索结果,能够充分挖掘不同专利之间的关联性,从而提高检索结果的可信度。
-
公开(公告)号:CN106547911A
公开(公告)日:2017-03-29
申请号:CN201611054238.8
申请日:2016-11-25
Applicant: 长城计算机软件与系统有限公司
IPC: G06F17/30
Abstract: 本发明涉及一种海量小文件的存取方法和系统,该方法包括以下步骤:对获取的业务数据所对应的业务文件进行压缩,得到文件压缩包;根据预设提取规则提取业务数据的特征值;当特征值未存储在文件索引库中时,根据预设编码规则对特征值进行编码,得到数据编码,并将特征值和数据编码的对应关系存储到文件索引库中;根据数据编码生成对应的目录结构;对文件压缩包进行解压,得到业务文件;将业务文件存入到目录结构的存储路径下;读取业务文件。本发明的有益效果是:高效的存储和读取海量小文件,系统接入简单,写入、读取批量数据效率高,且可以多方位弹性扩展。
-
公开(公告)号:CN106372051A
公开(公告)日:2017-02-01
申请号:CN201610916401.0
申请日:2016-10-20
Applicant: 长城计算机软件与系统有限公司
CPC classification number: G06F17/243 , G06F16/35 , G06K9/6223
Abstract: 本发明涉及一种专利地图的可视化方法和系统,该方法包括:获取专利文献数据集中每个专利文献对应的多维文本向量;对每个专利文献对应的多维文本向量进行聚类分析,得到多个聚类结果;将每个聚类结果对应的多个专利文献映射到二维平面,以进行降维处理并得到专利文献数据点;将多个专利文献数据点进行可视化计算,生成可视化数据,并将可视化数据在二维平面上显示成三维图像。本发明提供的一种专利地图的可视化方法和系统,能够简化专利地图生成过程中的运算量,从而减少对对CPU和内存的开销,实现实时生成专利地图并展现。
-
公开(公告)号:CN116092102A
公开(公告)日:2023-05-09
申请号:CN202211714858.5
申请日:2022-12-27
Applicant: 国家计算机网络与信息安全管理中心 , 长城计算机软件与系统有限公司
IPC: G06V30/412 , G06V30/413 , G06V30/18 , G06V30/162 , G06V30/148 , G06V30/19 , G06V10/44 , G06V10/26 , G06V10/28 , G06V10/48 , G06V10/764 , G06V10/82 , G06N3/044 , G06N3/08
Abstract: 本发明公开了一种包含文本信息的结构图的处理方法,所述方法包括:基于包含文本信息的结构图的线段组成进行轮廓检测;根据检测出的轮廓拟合出几何多边形;基于所述结构图中文本框的特征条件,从所述几何多边形中过滤掉不符合所述特征条件的形状,得到边框。本发明能够从包含有文本信息的结构图中高效、准确地提取出边框。
-
-
-
-
-
-
-
-
-