-
公开(公告)号:CN113869383A
公开(公告)日:2021-12-31
申请号:CN202111091011.1
申请日:2021-09-17
Applicant: 北京中科闻歌科技股份有限公司 , 深圳中科闻歌科技有限公司
Abstract: 本公开涉及一种变票实体检测方法及系统。该方法包括:获取多个实体的特征数据,实体包括待检测实体和待检测实体的关联实体,特征数据包括开票特征和属性特征,将特征数据输入至预先训练好的检测模型,得到预先训练好的检测模型输出的待检测实体的变票预测评分,若变票预测评分符合预设的变票实体检测条件,则确定待检测实体属于变票实体。通过上述技术方案,能够利用训练好的检测模型并结合待检测实体和关联实体的特征数据进行较高准确性和鲁棒性的实体预测,可以提高变票实体的预测准确性,以进一步满足税务稽查和征管等涉税业务的实际业务需求。
-
公开(公告)号:CN109815395B
公开(公告)日:2021-06-08
申请号:CN201811608345.X
申请日:2018-12-26
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/9535 , G06F16/957
Abstract: 本发明实施例涉及一种网页垃圾信息过滤方法、装置及存储介质,所述方法包括:按照设定处理规则对输入的原始文本进行分割,得到多个目标数据;对多个所述目标数据进行预处理;将经预处理后的多个目标数据进行向量化;确定经过向量化处理后的多个目标数据对应的多个相似度值;基于多个所述相似度值确定所述原始文本中的异常文本,够准确的提高内容识别系统的准确性和鲁棒性。
-
公开(公告)号:CN112308638A
公开(公告)日:2021-02-02
申请号:CN202011187087.X
申请日:2020-10-29
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本申请实施例提供一种虚开发票行为检测方法、装置、电子设备及存储介质,方法包括:确定目标纳税实体的涉税数据,涉税数据包含开票数据,从涉税数据中提取目标纳税实体的虚开发票行为特征向量,将虚开发票行为特征向量输入预先训练好的随机森林模型,以使随机森林模型输出目标纳税实体的虚开发票数据,若虚开发票数据满足预设条件,则确定目标纳税实体是虚开发票纳税实体。本方案充分考虑了涉税数据中蕴含的纳税实体的虚开发票行为特征,更加精细的刻画纳税实体的特点,采用预先训练好的随机森林模型,基于纳税实体的虚开发票行为特征对纳税实体进行虚开发票检测,避免了以往基于指标评价体系的方案中指标阈值难以科学合理确定的局限和不足。
-
公开(公告)号:CN109614478B
公开(公告)日:2020-12-08
申请号:CN201811552104.8
申请日:2018-12-18
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/332 , G06F40/30 , G06F40/289
Abstract: 本申请实施例涉及一种词向量模型的构建方法、关键词匹配方法及装置,所述方法包括:选取目标关键词,以及与所述目标关键词对应的一个或多个目标文档数据;基于所述目标关键词从网络上获取与所述目标关键词关联的多个关联文档数据;将所述目标文档数据和符合训练条件的关联文档数据作为训练文本,采用Gensim的Word2vec API对所述训练文本进行训练,得到词向量模型,其中,所述符合训练条件的关联文档数据为:与所述目标文档数据的相似度大于第一阈值的所述关联文档数据。该模型在训练过程中,结合选定的目标文档数据,以及通过目标文档数据再选定关联文档数据中符合训练条件的文档数据,提高了该模型的准确性。
-
公开(公告)号:CN110334275B
公开(公告)日:2020-12-04
申请号:CN201910471730.2
申请日:2019-05-31
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/9535 , G06F16/958
Abstract: 本发明公开了一种新闻流行度预测方法、设备和存储介质。该方法包括:获取待预测信息;按照预先确定的流行度影响特征类别,提取所述待预测信息的流行度影响特征;将所述流行度影响特征输入预先训练的集成了多个预测模型的多模型预测器中,获得所述多模型预测器输出的所述待预测信息的流行度。本发明使用集成了多个预测模型的多模型预测器对待预测信息进行信息流行度预测,采用多模型预测器预测信息流行度不仅可以提高预测模型预测结果的稳定性,还可以显著提高预测模型的预测性能,使得流行度预测更加稳定,预测结果更加精准。
-
公开(公告)号:CN110135693A
公开(公告)日:2019-08-16
申请号:CN201910296003.7
申请日:2019-04-12
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本申请涉及一种风险识别方法、装置、设备及存储介质,该方法包括:获取与业务数据对应的预设风险规则和风险分析模型;利用预设风险规则从业务数据中提取风险关联数据;利用风险分析模型对提取到的风险关联数据进行风险点识别,得到风险关联数据的风险点类别信息。该方法可以缓解单靠人力对每个融资平台的风险进行有效识别的难度,达到了提高平台风险识别效率的技术效果。
-
公开(公告)号:CN109800960A
公开(公告)日:2019-05-24
申请号:CN201811602925.8
申请日:2018-12-26
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本发明涉及一种品牌综合影响度评估方法、系统及存储介质。解决了现有的品牌综合影响度评估方法误差大,效率低的问题,本发明实施例包括获取品牌的传播力、影响力和转换力,并跟别获取传播力预设权重、影响力预设权重和转换力预设权重,根据所述品牌的传播力、影响力、转换力和传播力预设权重、影响力预设权重和转换力预设权重计算品牌综合影响度;本发明将网络舆情影响程度定量评价指标体系与品牌综合评价指标体系相结合,提出了一个新的品牌指数评估体系,使用方便,结合融媒体传播的时效性,灵活智能地运用品牌指数的统计算法,有效提升了评估的准确性和智能性,实现了融媒体平台品牌指数的智能性量化评估。
-
公开(公告)号:CN113449101B
公开(公告)日:2024-10-22
申请号:CN202010226687.6
申请日:2020-03-26
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/35 , G06F16/335 , G06F16/36
Abstract: 本发明实施例涉及一种公共卫生安全事件检测及事件集合构建方法及系统,方法包括:确定多个第一文本数据对应的多个主题信息,以及每个主题信息对应的至少一个第一文本数据;对每个主题信息对应的至少一个第一文本数据进行事件检测,确定每个主题信息对应的至少一个目标事件;将全部主题信息以及每个主题信息对应的至少一个目标事件作为事件集合;从互联网新闻流数据中获取与事件集合中主题信息相匹配的第二文本数据;基于第二文本数据与事件集合中目标事件的归属度对事件集合进行更新,基于静态文本数据构建的事件集合可以实现对动态文本数据的检测,进而提高互联网新闻流数据的检测效率,形成特定主题下相关舆情分析数据。
-
公开(公告)号:CN112364641B
公开(公告)日:2024-10-22
申请号:CN202011259475.4
申请日:2020-11-12
Applicant: 北京中科闻歌科技股份有限公司 , 深圳中科闻歌科技有限公司 , 国科智安(北京)科技有限公司
IPC: G06F40/284 , G06F40/166
Abstract: 本申请涉及一种面向文本审核的中文对抗样本生成方法及装置,其中方法包括:获取待处理语句信息;对待处理语句信息进行分词,得到多个词语;确定词语的第一重要性信息;获取各个词语对应的扰动词语;根据第一重要性信息,依次得到将待处理语句信息中各个词语替换为对应的扰动词语后的扰动语句信息;在确定扰动语句信息满足预设条件时,根据扰动语句信息得到对待处理语句信息攻击成功后的对抗样本。通过本实施例中的方法可以实现对待处理语句进行词语替换的方式得到对抗样本,进而可以增加用于对预测模型进行训练的样本的多样性,同时可以通过自动生成对抗样本,提升训练数据获取的便利性,提升模型训练的效率。
-
公开(公告)号:CN113220823B
公开(公告)日:2024-03-01
申请号:CN202010072425.9
申请日:2020-01-21
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/33 , G06F16/31 , G06F40/30 , G06F40/242 , G06F40/289 , G06F40/205 , G06Q50/00 , G06Q50/26
Abstract: 本申请涉及一种面向社交媒体公共言论的情感、话题及观点分析方法和装置,该方法包括:获取与公共事件对应的媒体报道信息以及公众舆论内容;按照第一预设策略分析所述媒体报道信息得到第一分析结果,按照第二预设策略分析所述公众舆论内容得到第二分析结果;对比所述第一分析结果和第二分析结果确定所述媒体报道信息与所述公众舆论内容的差异程度;根据所述差异程度规划所述公共事件的报道议程。该技术方案通过对网络公共事件的媒体报道信息以及公众舆论进行对比分析,能够得到公众对公众事件的观点以及情感倾向,并根据公众的观点以及情感倾向规划公共事件的报道议程,以此不仅(56)对比文件杨雨丹.言论差异与媒体公共性的建构——以都市报时评为中心的研究《.中国博士学位论文全文数据库 信息科技辑》.2013,(第2期),I141-11.
-
-
-
-
-
-
-
-
-