-
公开(公告)号:CN113449101A
公开(公告)日:2021-09-28
申请号:CN202010226687.6
申请日:2020-03-26
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/35 , G06F16/335 , G06F16/36
Abstract: 本发明实施例涉及一种公共卫生安全事件检测及事件集合构建方法及系统,方法包括:确定多个第一文本数据对应的多个主题信息,以及每个主题信息对应的至少一个第一文本数据;对每个主题信息对应的至少一个第一文本数据进行事件检测,确定每个主题信息对应的至少一个目标事件;将全部主题信息以及每个主题信息对应的至少一个目标事件作为事件集合;从互联网新闻流数据中获取与事件集合中主题信息相匹配的第二文本数据;基于第二文本数据与事件集合中目标事件的归属度对事件集合进行更新,基于静态文本数据构建的事件集合可以实现对动态文本数据的检测,进而提高互联网新闻流数据的检测效率,形成特定主题下相关舆情分析数据。
-
公开(公告)号:CN113051918A
公开(公告)日:2021-06-29
申请号:CN201911368962.1
申请日:2019-12-26
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/295 , G06K9/62 , G06N20/20
Abstract: 本发明公开了一种基于集成学习的命名实体识别方法、装置、设备和介质。该方法包括:将待识别的文本序列输入预先集成训练的命名实体识别模型;在命名实体识别模型中集成有多个基学习器并且每个基学习器对应一个权重;通过多个基学习器分别对输入的文本序列执行命名实体识别,得到每个基学习器输出的初始识别结果;根据每个基学习器输出的初始识别结果以及每个基学习器对应的权重,确定并输出文本序列的最终识别结果。本发明在命名实体识别模型中集成多个基学习器,并且集成训练多个基学习器,这使得命名实体识别模型的复杂度较低,降低了命名实体识别的耗时,提升了命名实体识别的时效性,也使得模型的训练过程简单易行。
-
公开(公告)号:CN108960280B
公开(公告)日:2020-07-24
申请号:CN201810488427.9
申请日:2018-05-21
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06K9/62
Abstract: 本发明涉及一种图片相似度检测方法及系统,该检测方法包括:分别筛选出互联网图片和参考图片中的互联网图片特征点和参考图片特征点;根据所有互联网图片特征点和所有参考图片特征点得到互联网图片和参考图片中的匹配特征点;当匹配特征点的个数大于或等于预设阈值时,互联网图片和参考图片相似。本发明实施例通过获取进行对比的两个图片的特征点,获取得到互联网图片和参考图片的特征点是否相匹配,并统计相匹配的特征点的数量,当匹配的特征点的数量超过预设阈值时,即可确认互联网图片和参考图片相似,本发明实施例计算数据量少,抗噪能力强,实现了快速识别检验图片之间是否相似。
-
公开(公告)号:CN110334275A
公开(公告)日:2019-10-15
申请号:CN201910471730.2
申请日:2019-05-31
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/9535 , G06F16/958
Abstract: 本发明公开了一种信息流行度预测方法、设备和存储介质。该方法包括:获取待预测信息;按照预先确定的流行度影响特征类别,提取所述待预测信息的流行度影响特征;将所述流行度影响特征输入预先训练的集成了多个预测模型的多模型预测器中,获得所述多模型预测器输出的所述待预测信息的流行度。本发明使用集成了多个预测模型的多模型预测器对待预测信息进行信息流行度预测,采用多模型预测器预测信息流行度不仅可以提高预测模型预测结果的稳定性,还可以显著提高预测模型的预测性能,使得流行度预测更加稳定,预测结果更加精准。
-
公开(公告)号:CN109816431A
公开(公告)日:2019-05-28
申请号:CN201811602910.1
申请日:2018-12-26
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06Q30/02 , G06F16/951 , G06F16/953 , G06F16/9535
Abstract: 本发明涉及一种品牌传播指数构建方法、系统及存储介质,解决了现有的品牌指数构建方法效率低、准确率差的问题,本发明包括新闻传播指数构建方法、微信公众号传播指数构建方法和微博传播指数构建方法,采用机器的方法对设计的品牌传播指标进行定量评价并量化计算方法进行量化评估,从而大大提高品牌评估的准确性和有效性,可更好地服务于现有品牌的评估量化工作,品牌指数构建方法效率高,评价的品牌指数准确率高,实用性强。
-
公开(公告)号:CN108960280A
公开(公告)日:2018-12-07
申请号:CN201810488427.9
申请日:2018-05-21
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06K9/62
Abstract: 本发明涉及一种图片相似度检测方法及系统,该检测方法包括:分别筛选出互联网图片和参考图片中的互联网图片特征点和参考图片特征点;根据所有互联网图片特征点和所有参考图片特征点得到互联网图片和参考图片中的匹配特征点;当匹配特征点的个数大于或等于预设阈值时,互联网图片和参考图片相似。本发明实施例通过获取进行对比的两个图片的特征点,获取得到互联网图片和参考图片的特征点是否相匹配,并统计相匹配的特征点的数量,当匹配的特征点的数量超过预设阈值时,即可确认互联网图片和参考图片相似,本发明实施例计算数据量少,抗噪能力强,实现了快速识别检验图片之间是否相似。
-
公开(公告)号:CN119782464A
公开(公告)日:2025-04-08
申请号:CN202411840115.1
申请日:2024-12-13
Applicant: 北京中科闻歌科技股份有限公司 , 中国科学院自动化研究所 , 航空工业信息中心
IPC: G06F16/3329 , G06F16/34 , G06F40/211 , G06F40/253 , G06F40/30 , G06N3/045
Abstract: 本发明提供了一种多文档摘要生成质量评估方法,方法包括:构建问答对的方式,针对每个文档生成问题及其对应的答案作为答案参考;接着,基于当前需要评估的摘要对问题进行答案生成;然后,基于能否回答问题、回答问题的准确性以及对摘要中是否包含异常句子获取当前需要评估的摘要的生成状态值。本发明能够不依赖于参考标准对多文档摘要的生成质量进行分析。
-
公开(公告)号:CN112329470B
公开(公告)日:2024-05-28
申请号:CN202011241374.4
申请日:2020-11-09
Applicant: 北京中科闻歌科技股份有限公司 , 深圳中科闻歌科技有限公司 , 国科智安(北京)科技有限公司
IPC: G06F40/295 , G06F40/226 , G06N3/08
Abstract: 本申请提供了一种基于端到端模型训练的智能地址识别方法及装置,属于计算机技术领域。本申请通过获取训练数据集,所述训练数据集包括多个地址文本数据及每个所述地址文本数据对应的验证数据;针对每个地址文本数据,生成所述地址文本数据对应的字符嵌入向量序列;将所述字符嵌入向量序列输入至第一级子模型;将每一级子模型的输出数据与所述验证数据比较,得到多个误差;根据所述多个误差调整所述地址文本识别模型的参数,直至所述地址文本识别模型收敛时,训练结束。通过本申请,可以将多个级联的子模型产生的多个误差,作为依据以调整地址文本识别模型的参数,减少多个级联子模型的整体误差,避免了多个子模型之间的误差累积。
-
公开(公告)号:CN115147925A
公开(公告)日:2022-10-04
申请号:CN202210765837.X
申请日:2022-07-01
Applicant: 天津大学 , 北京中科闻歌科技股份有限公司
Abstract: 本发明公开了一种基于弱监督学习的多对象场景时空动作定位方法及装置,计算原始数据集中的个体集的多个体包标签,并通过个体的特征向量计算出动作预测结果,计算多个体包标签与动作预测结果间的交叉熵损失;对于帧t寻找与其在一定范围内的临近帧,以阈值进行筛选,对合格的个体生成伪标签,考察无标签个体,计算其最大预测值与最可能的标签值之间的交叉熵损失,以阈值为标准进行筛选,将合格的个体新增为锚定个体;综合考虑交叉熵损失函数,以作为总损失函数,利用原始训练集以及伪标签后的新数据集进行参数更新,在完成指定轮训练后停止;将待识别视频分解为若干帧,将其逐帧输入训练完成的网络中进行动作识别,输出视频帧中所有个体的动作类别。
-
公开(公告)号:CN114004605A
公开(公告)日:2022-02-01
申请号:CN202111651786.X
申请日:2021-12-31
Applicant: 北京中科闻歌科技股份有限公司 , 深圳中科闻歌科技有限公司
Abstract: 本发明实施例涉及一种发票超限量申请审批方法、装置、设备和介质。该方法包括:获取待审批实体的实体信息和涉税数据,其中,所述待审批实体为发起发票超限量申请的实体;基于所述实体信息和所述涉税数据,构建第一基础特征向量;基于所述第一基础特征向量,生成第一衍生特征向量;其中,所述第一衍生特征向量用于反映所述待审批实体属于审批通过类型或审批拒绝类型的区分程度;将所述第一基础特征向量和所述第一衍生特征向量输入预先训练得到的目标申请审批模型,并基于模型输出结果确定对所述待审批实体发起的所述发票超限量申请的审批结果。通过上述技术方案,提高了审批方案的泛化性能和审批准确性。
-
-
-
-
-
-
-
-
-