一种实现对源码文件快速开源成分检测的方法和系统

    公开(公告)号:CN113722238B

    公开(公告)日:2022-04-26

    申请号:CN202111279629.0

    申请日:2021-11-01

    Applicant: 北京大学

    Inventor: 张涛 陈钟

    Abstract: 本申请公开的实施例提供了一种实现对源码文件快速开源成分检测的方法和系统。其中,该方法包括:根据目标源码文件生成第一Simhash值,将其与指纹库中的第二Simhash值匹配分析,得到其中的第三Simhash值;获取全部或部分的第三Simhash值对应的源码库源码文件(即辅助源码文件),以及根据辅助源码文件对目标源码文件进行代码比较或NLP文本相似度分析。通过基于Simhash算法的快速匹配分析,上述方案无疑将大幅度提高开源成分检测效率,而作为对弥补Simhash算法快速匹配可能造成的误报,上述方案中也通过相应的措施在较低开销下进行了纠正,确保了相关同源成分检测的精确度。

    一种视频行为时间轴检测方法

    公开(公告)号:CN108830212B

    公开(公告)日:2022-04-22

    申请号:CN201810597905.X

    申请日:2018-06-12

    Abstract: 本发明公布了一种视频行为时间轴检测方法,基于深度学习和时间结构建模,并结合粗粒度检测与细粒度检测做视频行为时间轴检测,在已有模型SSN的基础上,使用双流模型来提取视频的时空特征;对行为的时间结构进行建模,将单个行为分为三个阶段;接着提出一种新的能够有效提取视频行为的时间边界信息的特征金字塔;最后结合粗粒度检测与细粒度检测,使得检测结果更加精确;本发明的检测精度高,超过了当前已有的所有公开方法,具有广泛的适用性,可适用于智能监控系统或者人机监护系统中对人类感兴趣视频片段的检测,便于后续的分析与处理,具有重要的应用价值。

    Laingolide A及其非对映异构体、合成方法

    公开(公告)号:CN111943905A

    公开(公告)日:2020-11-17

    申请号:CN202010686729.4

    申请日:2020-07-16

    Abstract: 本申请属于合成技术领域,尤其涉及一种Laingolide A及其非对映异构体的合成方法,包括步骤:获取化合物8或ent-8;获取化合物15或18;将化合物8或ent-8与化合物15或18进行朱利亚烯烃合成反应,得到化合物A;对所述化合物A进行还原氢化处理,得到化合物B;对所述化合物B进行氧化处理,得到化合物C;对所述化合物C进行酰胺键组装后进行酯化反应,得到化合物D;对所述化合物D进行烯烃复分解反应后,进行烯烃异构化反应,得到Laingolide A或其非对映异构体。本申请实施例提供合成方法,路线清楚,合成效率高,有利于Laingolide A及非对映异构体的生物活性研究。

    一种用于动作的时间轴定位的回归分类模块和方法

    公开(公告)号:CN111553238A

    公开(公告)日:2020-08-18

    申请号:CN202010325817.1

    申请日:2020-04-23

    Abstract: 一种用于动作的时间轴定位的回归分类模块,包括:回归器,用于根据最初的动作的特征计算出回归后的动作位置,其中,动作的特征是指由特征提取器学习到的视频特征;池化层,用于根据整段视频特征以及回归后的动作位置为输入,输出回归后的动作特征;以及分类器,用于使用回归后的动作特征预测出对应于回归后位置的动作类别,其中,回归器位于分类器前。本发明的回归分类模块首次将回归器放置于分类器前,从而消除了并行的分类器与回归器所带来的最终预测结果中动作类别与位置不相符的问题。本发明同时也设计了新的分类损失函数,使用经过回归器回归后的位置来计算分类损失函数中的分类目标标签。

    一种基于弱监督学习的视频时序动作检测方法

    公开(公告)号:CN109409257A

    公开(公告)日:2019-03-01

    申请号:CN201811181395.4

    申请日:2018-10-11

    Abstract: 本发明涉及数字图像处理技术领域,具体为一种基于弱监督学习的视频时序动作检测方法。该方法具体步骤是,步骤1:把视频输入分类器,分别得到不同的检测置信度;步骤2:融合视频在不同分类器的得分;步骤3:条件随机场精调结果;检测阶段的步骤是,步骤4:把待检测视频输入训练出的分类器,得到不同的检测置信度;步骤5:通过FC-CRF优化融合不同的检测置信度。本方法可将人类的先验知识和神经网络的输出结合起来,实验结果表明FC-CRF在ActivityNet上提高了20.8%mAP@0.5的检测性能。

    一种基于间隔优化的集成学习方法及装置

    公开(公告)号:CN108090510A

    公开(公告)日:2018-05-29

    申请号:CN201711345271.0

    申请日:2017-12-15

    CPC classification number: G06K9/6227 G06K9/6256

    Abstract: 本发明公开了一种基于间隔优化的集成学习方法及装置。其中,所述方法包括:1)得到一组训练好的基分类器;2)获取基分类器对所有训练样本的预测值;3)通过最优化集成模型间隔的分布来优化每个基分类器的权重;4)使用优化后的权重对样本的预测值进行加权平均,从而得到最终的预测值和标记。本发明还公开了一种基于间隔优化的集成学习装置。本发明中基于间隔优化的集成学习方法及装置不依赖于具体的基分类算法,可以针对分类误差或AUC进行优化,且整个模型易于求解,具有十分广泛的适用性。在优化权重时通过引入了间隔来平衡准确性和多样性,可以有效的避免过拟合问题,并提高最终集成模型的预测效果。

    论坛贴内容抽取方法和装置

    公开(公告)号:CN103116591B

    公开(公告)日:2016-04-20

    申请号:CN201110366367.1

    申请日:2011-11-17

    Abstract: 本发明提供了一种论坛贴内容抽取方法,包括:由论坛贴的源代码生成HTML标签树;将HTML标签树中的文本率大于第一阈值的标签子树合并得到一颗最大候选子树;从最大候选子树中筛选得到所有具有相似结构的节点簇;从节点簇中筛选文本率大于第二阈值的节点簇;抽取筛选的节点簇中的文本内容。本发明还提供了一种论坛贴内容抽取装置。本发明实现了论坛贴内容的自动抽取。

    可资源化的挥发性有机尾气处理方法及撬装移动装置

    公开(公告)号:CN103463937B

    公开(公告)日:2015-08-12

    申请号:CN201310319801.X

    申请日:2013-07-25

    Abstract: 本发明涉及可资源化的挥发性有机尾气处理方法;含VOCs的尾气首先进入气液分离器,分离后气相由风机输出端进入喷淋室处理,去除污染物的气体从喷淋室顶排出到吸附室进一步净化后排放到大气,喷淋剂富液从喷淋室下排出,在热交换器换热后进入到分离室,分离室顶部放出有机污染物混合气相,气相经过冷凝器将携带一部分的喷淋剂冷凝后返回分离室,剩余的未凝气相由深冷器冷凝后回收到污染物储存罐,深冷器后设有真空调节系统,分离室下部连接加热釜,热分离后的喷淋剂贫液经热交换器冷却后由泵输送到喷淋室进行循环利用。本发明适用性广泛,可以处理高低浓度不同污染程度场所的VOCs尾气,另外装置的撬装式结构可根据污染现场需要而移动。

    一种站点语种分类的方法和系统

    公开(公告)号:CN104572767A

    公开(公告)日:2015-04-29

    申请号:CN201310514221.6

    申请日:2013-10-25

    CPC classification number: G06F17/30864

    Abstract: 本发明提供一种站点语种分类的方法和系统,包括:对于每一种语种,利用该语种的预设搜索词进行搜索,得到对应于该语种的所有页面链接;根据所述所有页面链接的链接地址,将所有页面链接分类,每一类对应一个站点;从每一个站点对应的分类中抽样部分页面链接,组成样本集合,根据样本集合中页面链接的数量和语种信息,生成对应于该语种的训练模型;将需检测的网页资源的页面链接集合按照站点进行分类,得到各个需检测的站点;根据所述语种训练模型,得到每一个所述需检测的站点的语种预测值。本发明基于网页单页面语种识别技术,给出了一种合理高效的站点语种分类方法,系统架构简单易维护,满足了现代搜索引擎技术的要求。

    搜索方法和搜索引擎
    10.
    发明公开

    公开(公告)号:CN104572643A

    公开(公告)日:2015-04-29

    申请号:CN201310470200.9

    申请日:2013-10-10

    CPC classification number: G06F17/30864

    Abstract: 本发明提供一种搜索方法和搜索引擎,通过接收用户终端发送的用于对网页进行搜索的关键字,利用各从节点的内存中存储的第一索引文件,进行搜索,获得与关键字相匹配的第一匹配网页后,若第一匹配网页的个数少于第一阈值,再利用各节点的磁盘中所存储的第二索引文件,进行搜索,获得与所述关键字相匹配的第二匹配网页,向用户终端发送包含第一匹配网页和第二匹配网页的搜索结果,由于首先利用内存中存储的第一索引文件进行搜索,不需要占用I/O接口,从而避免了由于全部将索引文件存储在磁盘所导致的检索速度下降,提高了检索效率。

Patent Agency Ranking