-
公开(公告)号:CN112685204A
公开(公告)日:2021-04-20
申请号:CN202011593204.2
申请日:2020-12-29
Applicant: 北京中科闻歌科技股份有限公司 , 北京中科闻歌智安科技有限公司 , 深圳中科闻歌科技有限公司
Abstract: 本申请涉及一种基于异常检测的社交机器人检测方法及装置,其中方法包括:在目标数据源中,筛选得到满足预设数量要求,且对应于目标类别的待检测信息;通过确定发布各个所述待检测信息的账户,得到每个所述账户对应的待检测信息集;根据所述待检测信息集,确定所述账户对应的行为特征信息;采用预设异常检测算法对所述行为特征信息进行异常检测,确定所有行为特征信息中的异常行为特征信息;基于异常行为特征信息确定所有账户中的社交机器人账户。通过本实施例中的方法,只依赖于筛选得到的待检测信息即可快速确定社交机器人账户,相对于人工筛选,可以有效提高处理效率以及准确率。
-
公开(公告)号:CN112308638A
公开(公告)日:2021-02-02
申请号:CN202011187087.X
申请日:2020-10-29
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本申请实施例提供一种虚开发票行为检测方法、装置、电子设备及存储介质,方法包括:确定目标纳税实体的涉税数据,涉税数据包含开票数据,从涉税数据中提取目标纳税实体的虚开发票行为特征向量,将虚开发票行为特征向量输入预先训练好的随机森林模型,以使随机森林模型输出目标纳税实体的虚开发票数据,若虚开发票数据满足预设条件,则确定目标纳税实体是虚开发票纳税实体。本方案充分考虑了涉税数据中蕴含的纳税实体的虚开发票行为特征,更加精细的刻画纳税实体的特点,采用预先训练好的随机森林模型,基于纳税实体的虚开发票行为特征对纳税实体进行虚开发票检测,避免了以往基于指标评价体系的方案中指标阈值难以科学合理确定的局限和不足。
-
公开(公告)号:CN109614478B
公开(公告)日:2020-12-08
申请号:CN201811552104.8
申请日:2018-12-18
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/332 , G06F40/30 , G06F40/289
Abstract: 本申请实施例涉及一种词向量模型的构建方法、关键词匹配方法及装置,所述方法包括:选取目标关键词,以及与所述目标关键词对应的一个或多个目标文档数据;基于所述目标关键词从网络上获取与所述目标关键词关联的多个关联文档数据;将所述目标文档数据和符合训练条件的关联文档数据作为训练文本,采用Gensim的Word2vec API对所述训练文本进行训练,得到词向量模型,其中,所述符合训练条件的关联文档数据为:与所述目标文档数据的相似度大于第一阈值的所述关联文档数据。该模型在训练过程中,结合选定的目标文档数据,以及通过目标文档数据再选定关联文档数据中符合训练条件的文档数据,提高了该模型的准确性。
-
公开(公告)号:CN110334275B
公开(公告)日:2020-12-04
申请号:CN201910471730.2
申请日:2019-05-31
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/9535 , G06F16/958
Abstract: 本发明公开了一种新闻流行度预测方法、设备和存储介质。该方法包括:获取待预测信息;按照预先确定的流行度影响特征类别,提取所述待预测信息的流行度影响特征;将所述流行度影响特征输入预先训练的集成了多个预测模型的多模型预测器中,获得所述多模型预测器输出的所述待预测信息的流行度。本发明使用集成了多个预测模型的多模型预测器对待预测信息进行信息流行度预测,采用多模型预测器预测信息流行度不仅可以提高预测模型预测结果的稳定性,还可以显著提高预测模型的预测性能,使得流行度预测更加稳定,预测结果更加精准。
-
公开(公告)号:CN110135693A
公开(公告)日:2019-08-16
申请号:CN201910296003.7
申请日:2019-04-12
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本申请涉及一种风险识别方法、装置、设备及存储介质,该方法包括:获取与业务数据对应的预设风险规则和风险分析模型;利用预设风险规则从业务数据中提取风险关联数据;利用风险分析模型对提取到的风险关联数据进行风险点识别,得到风险关联数据的风险点类别信息。该方法可以缓解单靠人力对每个融资平台的风险进行有效识别的难度,达到了提高平台风险识别效率的技术效果。
-
公开(公告)号:CN109800960A
公开(公告)日:2019-05-24
申请号:CN201811602925.8
申请日:2018-12-26
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本发明涉及一种品牌综合影响度评估方法、系统及存储介质。解决了现有的品牌综合影响度评估方法误差大,效率低的问题,本发明实施例包括获取品牌的传播力、影响力和转换力,并跟别获取传播力预设权重、影响力预设权重和转换力预设权重,根据所述品牌的传播力、影响力、转换力和传播力预设权重、影响力预设权重和转换力预设权重计算品牌综合影响度;本发明将网络舆情影响程度定量评价指标体系与品牌综合评价指标体系相结合,提出了一个新的品牌指数评估体系,使用方便,结合融媒体传播的时效性,灵活智能地运用品牌指数的统计算法,有效提升了评估的准确性和智能性,实现了融媒体平台品牌指数的智能性量化评估。
-
公开(公告)号:CN108874870A
公开(公告)日:2018-11-23
申请号:CN201810375770.2
申请日:2018-04-24
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种数据抽取方法、设备及计算机可存储介质。所述方法包括:获取HTML文本;根据预设的内容抽取规则,在所述HTML文本中抽取预设类型的数据;根据在所述HTML文本中抽取的预设类型的数据,生成结构化数据。本发明预先设置内容抽取规则,利用该内容抽取规则,可以对HTML文本进行细粒度的结构化抽取,进而可以获得各种类型的数据,得到包含各种类型数据的结构化数据,抽取速度快,抽取精度高。
-
公开(公告)号:CN108829659A
公开(公告)日:2018-11-16
申请号:CN201810418503.9
申请日:2018-05-04
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F17/27
Abstract: 本发明公开了一种引用识别方法、设备和计算机可存储介质。所述方法,包括:获取原创语料和候选语料;利用预设的ROUGE算法计算所述原创语料和所述候选语料的ROUGE值;根据所述原创语料和所述候选语料的ROUGE值的大小,确定所述候选语料引用所述原创语料的程度。本发明解决了通过相似度比较算法不能识别部分引用的问题,本发明利用ROUGE算法,计算两个语料之间的ROUGE值,根据该ROUGE值可以识别出两个语料直接是否存在全部引用关系或者部分引用关系。
-
公开(公告)号:CN119783663A
公开(公告)日:2025-04-08
申请号:CN202411861891.X
申请日:2024-12-17
Applicant: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司
IPC: G06F40/258 , G06N3/0455 , G06N3/08
Abstract: 本发明提供了一种基于大语言模型的事件名生成方法、设备及介质,涉及事件名生成技术领域,所述方法包括:获取目标文章集合A;将A中的每一篇目标文章输入至预设的预训练语言模型,以得到标题摘要组列表B;获取B中每一标题摘要组对应的token长度,以得到B对应的token长度列表NB;确定B对应的分批处理的初始批次数量NUM;若NUM>1,则将B划分为若干批次,以得到B对应的批次列表C;根据C和预设的大语言模型,得到目标事件对应的事件名称;本发明中的方法,在生成事件的名称的过程中,结合目标事件的多篇目标文章,所参考的信息较多,从而使得生成的目标事件的名称更加准确。
-
公开(公告)号:CN119782889A
公开(公告)日:2025-04-08
申请号:CN202411952956.1
申请日:2024-12-27
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F18/24 , G06F18/213 , G06V10/44 , G06N3/0455 , G06F18/22 , G06N3/048
Abstract: 本申请涉及一种基于大模型的多模态假新闻检测方法、装置、及设备,尤其涉及信息处理技术领域。包括:将多模态待测新闻分别输入大模型gte‑Qwen2‑1.5B‑instruct、预训练视觉模型SwinT和预训练图文对比模型Clip,得到文本特征、图像特征以及文本对比特征和图像对比特征;计算归一化后的文本对比特征与图像对比特征之间的余弦相似度,得到图文相似度;将图文相似度作为注意力矩阵阈值来增强文本特征和图像特征,以提取局部异同特征;将图文相似度作为权重来增强文本特征和图像特征,以提取全局异同特征;将局部异同特征和全局异同特征输入假新闻分类器,得到假新闻分类器输出的多模态待测新闻的真实性预测值。
-
-
-
-
-
-
-
-
-