一种基于深度学习与哈希算法的多模态检索方法

    公开(公告)号:CN116204694A

    公开(公告)日:2023-06-02

    申请号:CN202310126081.9

    申请日:2023-02-15

    Abstract: 本发明提出一种基于深度学习与哈希算法的多模态检索方法,包括,获取待检索的多模态数据;基于深度学习与哈希编码的方法对多模态数据进行文本语义检索,获取文本数据;基于灰度级比较的方法和ElasticSearch技术对多模态数据进行图片检索,获取图片数据;使用基于双编码器的模型将文本数据和图片数据映射至统一的向量子空间中;通过计算余弦相似度得到文本数据和所述图片数据在向量子空间中的相似度距离,得到候选集;使用基于融合编码器的模型在候选集上计算相似度并进行排序,得到多模态数据的检索结果。通过本发明提出的方法,实现了大规模数据集上的高效率高精度多模态检索任务。

    一种利用云原生资源的数据湖构建方法

    公开(公告)号:CN115809149B

    公开(公告)日:2023-04-28

    申请号:CN202310083078.3

    申请日:2023-02-08

    Abstract: 本发明提出一种利用云原生资源的数据湖构建方法,包括,构建数据源及数据源表、数据湖数据目录;配置入湖任务,根据数据源表以及数据湖数据目录生成入湖任务参数,将入湖任务以及入湖任务参数提交至服务应用中心;通过服务应用中心将所述入湖任务以及入湖任务参数转发至任务调度中心入湖队列,在计算资源状态处于空闲时,将入湖任务以及入湖任务参数转发至资源调度中心;通过资源调度中心解析入湖任务参数,获取数据源及数据源表,对数据源及数据源表做映射获取数据源元数据信息和中间表元数据信息,生成抽象语法树,并基于抽象语法树生成任务计划,根据任务计划调度计算资源在对应数据湖数据目录执行数据写入任务,完成数据湖的构建。

    科技咨询实体画像联机分析处理的分析方法及装置

    公开(公告)号:CN115934853A

    公开(公告)日:2023-04-07

    申请号:CN202211510448.9

    申请日:2022-11-29

    Abstract: 本发明公开了科技咨询实体画像联机分析处理的分析及装置,该方法包括:基于前台属性标签和后台属性标签得到实体属性标签;其中,后台属性标签是基于对科技咨询场景下的实体原始数据的处理得到;根据实体属性标签和预设的数据类型转换关系表进行对应的数据标签转换,将转换后的数据标签进行存储得到数据存储结果;基于数据存储结果将预设的用户规则转换得到JSON格式数据,解析JSON格式数据生成相应的SQL语句查询结果;基于SQL语句查询结果进行数据渲染,根据渲染结果完成科技咨询场景下的实体画像分析。本发明消除了科技咨询实体属性间的差异,实现了数据的灵活查询以及毫秒级响应,推动实现产业数字化与数据价值化。

    基于注意力机制的交通标志检测方法和装置

    公开(公告)号:CN110135307B

    公开(公告)日:2022-07-01

    申请号:CN201910365006.1

    申请日:2019-04-30

    Abstract: 本申请提出一种基于注意力机制的交通标志检测方法和装置,其中,方法包括:通过获取待检测图像,根据贪心策略算法对待检测图像进行切片,得到符合预设条件的获取至少一个目标检测区域,其中,目标检测区域中包含所有交通标志区域;将至少一个目标检测区域输入预先训练的检测模型,获取与每个目标检测区域对应的候选预测结果,根据非极大抑制算法对所有目标检测区域对应的候选预测结果进行去噪,获取目标预测结果,其中,目标预测结果中包含所述待检测图像中的交通标志类别信息和位置信息。由此,通过预先训练的检测模型对待检测图像进行交通标志检测,提高了交通标志检测的精度值和效率。

    基于知识图谱和Transformer的专利推荐方法

    公开(公告)号:CN110737778B

    公开(公告)日:2022-05-31

    申请号:CN201910831234.3

    申请日:2019-09-04

    Abstract: 本发明公开了一种基于知识图谱和Transformer的专利推荐方法,包括以下步骤:爬取专利资源库构建知识图谱;通过图卷积网络和注意力机制的混合模型挖掘知识图谱,得到用户和专利的内容特征表示向量;通过Transformer模型挖掘用户信息,得到用户历史偏好的序列特征向量;将内容特征表示向量和序列特征向量级联结合,输入Transformer模型的Softmax层计算,得到多个候选专利被推荐的概率值;对多个概率值进行Top‑k排序,得到Top‑k个专利作为目标用户的推荐结果。该方法采用知识图谱丰富特征表示,采用Transformer挖掘行为序列特征,提高推荐结果的精准性和可解释性。

    专利知识图谱的构建方法及装置

    公开(公告)号:CN110457487B

    公开(公告)日:2022-03-29

    申请号:CN201910620962.X

    申请日:2019-07-10

    Abstract: 本发明公开了一种专利知识图谱的构建方法及装置,其中,方法包括以下步骤:从互联网爬取专利相关网站的半结构化数据;对半结构化数据进行处理,得到初始专利数据;根据初始专利数据得到每篇专利的专利属性,并根据每篇专利的专利属性IPC条件对应的IPC分类树,并构建专利知识图谱。该方法可以利用IPC分类号的优势进行知识图谱构建,并从标题与摘要中提取知识进行本体扩建与知识扩展,从而不仅有助于主题的精细化,而且可以减少了人工标注的步骤,且仅需要人工审查即可完成知识图谱的扩充,并可以获取更多细分知识。

    基于科技咨询大规模图数据的查询任务优化方法

    公开(公告)号:CN114020781A

    公开(公告)日:2022-02-08

    申请号:CN202111316037.1

    申请日:2021-11-08

    Abstract: 本公开提供的基于科技咨询大规模图数据的查询任务优化方法、系统及存储介质中,获取查询任务的标识,并根据查询任务的标识,选择对应的查询优化方法,其中,查询优化方法包括调整图遍历展开顺序策略、Cardinality减少、模式提前、物化视图,然后利用查询优化方法对图数据库进行查询,输出查询结果。由此可知,本公开提出的方法中,可以根据查询任务的标识选择对应的查询优化方法,提高了查询方法的灵活性。同时,本公开提出的方法中,查询优化方法提高了科技咨询大规模图数据不同场景下查询任务的查询效率,降低了查询计算的复杂度,缩短了查询所花费的时间。

    基于组合赋权与模糊灰色聚类的科技服务质量评估方法和装置

    公开(公告)号:CN113792982A

    公开(公告)日:2021-12-14

    申请号:CN202110956883.3

    申请日:2021-08-19

    Abstract: 本申请公开了一种基于组合赋权与模糊灰色聚类的科技服务质量评估方法及装置,该方法包括:分析科技资源服务平台服务质量根据构造的指标集得到服务质量的评估结果,并将指标数据进行检验根据多数集结加权的层次分析法和赋权法计算指标数据的主观权重和客观权重,采用组合赋权法将主观权重和客观权重结合,利用灰色聚类理论将评估对象代入白化权函数计算不同聚类指标含有的白化值,得到二级指标服务质量评估结果,根据评估指标体系和二级指标服务质量评价结果,进行一级指标评估,以完成对科技资源服务平台服务质量的评估。本发明使模型能根据有限样本数据得到准确、综合的服务质量评估结果对提升科技服务水平、促进科技资源开放共享具有指导意义。

Patent Agency Ranking