-
公开(公告)号:CN113449601B
公开(公告)日:2023-05-16
申请号:CN202110591209.X
申请日:2021-05-28
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC: G06V40/10 , G06V20/40 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/084
Abstract: 本发明提出一种基于渐进性平滑损失的行人重识别模型训练方法,包括:获取训练样本数据;其中,所述训练样本数据包括多个包含行人的视频;将所述训练样本数据输入至初始模型中,得到对应各所述包含行人的视频的帧级别特征和视频级别特征;分别基于所述帧级别特征和所述视频级别特征计算第一损失和第二损失;基于所述第一损失和所述第二损失对所述初始模型的模型参数进行优化,得到行人重识别模型。
-
公开(公告)号:CN113343810A
公开(公告)日:2021-09-03
申请号:CN202110590381.3
申请日:2021-05-28
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
Abstract: 本发明提出一种基于时序多样性与相关性的行人重识别模型训练方法,包括以下步骤:获取训练样本数据,所述训练样本数据包括多个包含行人的视频序列;将所述训练样本数据输入至初始模型中采样各所述包含行人的视频序列的多帧视频,并且提取所述多帧视频的帧级别特征,聚合所述帧级别特征得到视频级别特征;基于所述视频级别特征计算视频级别损失;基于所述视频级别损失对所述初始模型的模型参数进行优化,得到行人重识别模型。
-
公开(公告)号:CN110287314B
公开(公告)日:2021-08-06
申请号:CN201910418900.0
申请日:2019-05-20
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/35
Abstract: 本发明涉及一种基于无监督聚类的长文本可信度评估方法,包括:以已知长文本获取训练数据,提取该训练数据的训练特征以构建训练特征向量集,对该训练特征向量集进行无监督聚类,得到多个训练类心;以待评估长文本获取评估数据,提取该评估数据的评估特征向量;获取该评估特征向量相对该训练类心的评估值,并以该评估值得到该待评估长文本的可信度。本发明通过无监督聚类对长文本进行可信度评估,在实施过程中不需要标注数据,节省了人力、物力与时间,避免了数据中标签稀疏带来的困扰;提取了长文本的文本特征,对于可信度评估任务更加适用,使用该模型得到的文本的可信度更具有可解释性,同时在平台之间可以迁移。
-
公开(公告)号:CN109829089B
公开(公告)日:2021-03-05
申请号:CN201811516557.5
申请日:2018-12-12
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/906 , G06F16/958 , G06Q50/00
Abstract: 本发明涉及一种基于关联图谱的社交网络用户异常检测方法和系统,针对现有事件可视化展示技术的不足以及事件、用户、事件主题等多种实体关联性较弱不易于进行用户异常检测,提出一种基于微博平台的事件可视化方法以及事件、用户、事件主题等多种实体构建异构关联网络图谱进行用户异常检测;在不缺失事件信息的同时,让使用者更加全面、深入地了解整个事件的发展演变过程,并根据已有的异构关联网络图谱更加直观的进行用户异常检测。
-
公开(公告)号:CN109388768A
公开(公告)日:2019-02-26
申请号:CN201811008673.6
申请日:2018-08-31
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/958
Abstract: 本发明涉及一种基于附加分支处理服务的采集方法和系统,包括:获取采集任务,该采集任务具有多个处理步骤和分支号;依次执行该采集任务中的处理步骤,并在每一个处理步骤执行前,根据该分支号判断是否调用该附加分支处理服务,若是,则通过调用该附加分支处理服务执行附加处理流程,并替代将要执行的处理步骤,否则执行将要执行的处理步骤。由此,本发明采用附加分支的技术,能够应对信源的各种复杂情况。且针对附加分支单独开发,容易崩溃的情况,采用服务化方法执行附加分支,并且附加分支运行器可以在崩溃自动重启,可以避免附加分支崩溃带来的采集器崩溃问题。
-
公开(公告)号:CN109241483A
公开(公告)日:2019-01-18
申请号:CN201811008674.0
申请日:2018-08-31
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/958
Abstract: 本发明涉及一种基于域名推荐的网站发现方法,包括:在域名字符集随机选取任意字符排列组合以获得词根字符串;以该词根字符串组成候选字符串;将该候选字符串与候选域名后缀进行拼接,组成推荐域名;对该推荐域名进行DNS解析,以判断为合法的该推荐域名为合法域名;验证该合法域名是否存在对应网站,若存在则获取为目标网站。
-
公开(公告)号:CN103778200A
公开(公告)日:2014-05-07
申请号:CN201410010836.X
申请日:2014-01-09
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F17/30
CPC classification number: G06F17/30684
Abstract: 本发明公开了一种报文信息源抽取方法及其系统,该方法通过匹配信息源抽取规则库的关键词提取报文中的信息源,并匹配信息源抽取规则库的规则判断信息源类型,该方法包括:报文解析步骤和信息源抽取步骤,报文解析步骤用于根据输入的文本,提取文本中的字符,并对字符进行断句处理为不同分句,信息源抽取步骤为根据信息源抽取规则库对分句进行关键词匹配,对分句抽取有用要素序列,并在有用要素序列上,提取信息源,并通过匹配信息源抽取规则库的规则判断信息源类型。
-
公开(公告)号:CN112667872B
公开(公告)日:2023-04-07
申请号:CN202011290564.5
申请日:2020-11-17
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
IPC: G06F16/951 , G06F16/9532 , G06F16/25 , G06F9/445 , G16H50/80
Abstract: 本发明公开了新冠肺炎疫情数据的实时采集方法,包括以下步骤:一、建立配置文件,将多个信源网站内实时反映疫情数据的网页的基本信息预置在配置文件中,包括多个字段的名称、各字段的存储路径,各字段的被采纳次数;二、采集网页数据,通过配置文件中待采集字段的存储路径从多个信源网站采集待采集字段当前的数值;三、数据对齐处理,以待采集字段的数据对齐结果为待采集字段的采集数据;步骤四、更新配置文件,将各信源网站中待采集字段的数值与待采集字段的采集数据相同的信源网站中待采集字段的被采纳次数加1。本发明的方法从多个信源网站的实时数据中获取可信度最高的数据作为采集数据,提高了疫情实时数据的准确性。
-
公开(公告)号:CN109241483B
公开(公告)日:2021-10-12
申请号:CN201811008674.0
申请日:2018-08-31
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/958
Abstract: 本发明涉及一种基于域名推荐的网站发现方法,包括:在域名字符集随机选取任意字符排列组合以获得词根字符串;以该词根字符串组成候选字符串;将该候选字符串与候选域名后缀进行拼接,组成推荐域名;对该推荐域名进行DNS解析,以判断为合法的该推荐域名为合法域名;验证该合法域名是否存在对应网站,若存在则获取为目标网站。
-
公开(公告)号:CN113449601A
公开(公告)日:2021-09-28
申请号:CN202110591209.X
申请日:2021-05-28
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
Abstract: 本发明提出一种基于渐进性平滑损失的行人重识别模型训练方法,包括:获取训练样本数据;其中,所述训练样本数据包括多个包含行人的视频;将所述训练样本数据输入至初始模型中,得到对应各所述包含行人的视频的帧级别特征和视频级别特征;分别基于所述帧级别特征和所述视频级别特征计算第一损失和第二损失;基于所述第一损失和所述第二损失对所述初始模型的模型参数进行优化,得到行人重识别模型。
-
-
-
-
-
-
-
-
-