-
公开(公告)号:CN116743343B
公开(公告)日:2024-01-23
申请号:CN202310763263.7
申请日:2023-06-26
Applicant: 天津大学 , 北京中科闻歌科技股份有限公司
IPC: H04L9/00 , H04L9/32 , H04L67/565
Abstract: 本发明公开了一种面向复杂网络环境的高性能区块链共识方法,属于区块链技术领域;本发明提出了一种能满足在大规模复杂广域网条件下的高性能低延迟的共识方法,通过对区块结构进行了重新设计,满足了异步区块传输、流式区块执行的需求;同时设计了异步区块传输协议,避免了节点带宽不同,网络波动所带来的性能影响;更进一步地,设计了区块流式区块执行协议,在保证执行结果正确的前提下,加速了大部分区块交易的确认延时。
-
公开(公告)号:CN115713427A
公开(公告)日:2023-02-24
申请号:CN202211408253.3
申请日:2022-11-10
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06Q40/12
Abstract: 本公开涉及一种新迁入企业税前税源管理方法、装置、设备及存储介质。本公开实施例,通过获取新迁入企业的第一经营纳税数据以及与新迁入企业存在关联关系的其他企业的第二经营纳税数据;对第一经营纳税数据进行特征提取处理,得到新迁入企业的纳税异常特征向量;确定各关联关系对应的新迁入企业所属的企业社区以及社区特征向量;基于纳税异常特征向量和社区特征向量得到新迁入企业对应的税前监控特征向量;将税前监控特征向量输入预设的新迁入企业税前监控模型,基于企业税前监控模型对新迁入企业进行税前监控,可以在海量新迁入企业的税前税源管理中对异常新迁入企业进行精准稳定地的识别与预警,提高对异常税源预警响应的时效性和准确性。
-
公开(公告)号:CN115271892A
公开(公告)日:2022-11-01
申请号:CN202210547647.0
申请日:2022-05-18
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06Q40/00 , G06F16/2458 , G06F16/2457 , G06N3/04 , G06N3/08 , G06Q50/26
Abstract: 本公开实施例提供了一种骗取留抵退税识别模型的构建方法、装置、设备和存储介质。骗取留抵退税识别模型构建方法包括获取多个样本退税申请数据序列和对应的实体标签;基于样本退税申请数据序列确定对应的第一特征向量;基于多个第一特征向量和对应的实体标签对预先构建的骗取留抵退税识别模型进行训练。骗取留抵退税识别模型构建方法能够直接挖掘样本退税申请数据的特征构建骗取留抵退税识别模型,而无需如现有专家评价指标体系的方法需要依靠专家经验设定评价指标、指标权重和指标阈值的问题。
-
公开(公告)号:CN113536802A
公开(公告)日:2021-10-22
申请号:CN202010319243.7
申请日:2020-04-21
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本申请涉及一种小语种文本数据的情感判别方法、装置、设备和存储介质。所述方法包括:获取文本数据;提取文本数据的多个文本特征;将文本特征输入支持向量机模型,得到文本数据的第一评价特征;将文本数据输入mBERT模型,得到文本数据的第二评价特征;输入第一评价特征和第二评价特征至情感判别器,输出文本数据的情感判别结果。支持向量机模型所采用的语言本身的特征进行判别时,可以提高对不同语言的情感判别准确度,采用mBERT学习不同语言深度语义向量进行的不同语言情感判别,可以很好的提升模型判别的泛化能力。
-
公开(公告)号:CN113379169A
公开(公告)日:2021-09-10
申请号:CN202110924546.6
申请日:2021-08-12
Applicant: 北京中科闻歌科技股份有限公司 , 深圳中科闻歌科技有限公司
Abstract: 本公开涉及一种信息处理方法、装置、设备及介质。其中,信息处理方法包括:获取目标社会实体的目标社会实体信息;从目标社会实体信息中提取目标社会实体的与登记注册相关的目标特征向量;将目标特征向量输入预先训练好的梯度提升树模型,得到预先训练好的梯度提升树模型输出的目标社会实体的预测信用评分;若目标社会实体的预测信用评分符合预设的空壳实体检测条件,则确定目标社会实体为空壳实体。根据本公开实施例,能够提高对目标社会实体进行空壳实体检测的准确性,以满足税务稽查、风控预警等部门的实际业务需求。
-
公开(公告)号:CN113220823A
公开(公告)日:2021-08-06
申请号:CN202010072425.9
申请日:2020-01-21
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/33 , G06F16/31 , G06F40/30 , G06F40/242 , G06F40/289 , G06F40/205 , G06Q50/00 , G06Q50/26
Abstract: 本申请涉及一种面向社交媒体公共言论的情感、话题及观点分析方法,该方法包括:获取与公共事件对应的媒体报道信息以及公众舆论内容;按照第一预设策略分析所述媒体报道信息得到第一分析结果,按照第二预设策略分析所述公众舆论内容得到第二分析结果;对比所述第一分析结果和第二分析结果确定所述媒体报道信息与所述公众舆论内容的差异程度;根据所述差异程度规划所述公共事件的报道议程。该技术方案通过对网络公共事件的媒体报道信息以及公众舆论进行对比分析,能够得到公众对公众事件的观点以及情感倾向,并根据公众的观点以及情感倾向规划公共事件的报道议程,以此不仅可以更好了解公众的意愿,还能促进社交媒体平台的健康发展。
-
公开(公告)号:CN112364641A
公开(公告)日:2021-02-12
申请号:CN202011259475.4
申请日:2020-11-12
Applicant: 北京中科闻歌科技股份有限公司 , 深圳中科闻歌科技有限公司 , 北京中科闻歌智安科技有限公司
IPC: G06F40/284 , G06F40/166
Abstract: 本申请涉及一种面向文本审核的中文对抗样本生成方法及装置,其中方法包括:获取待处理语句信息;对待处理语句信息进行分词,得到多个词语;确定词语的第一重要性信息;获取各个词语对应的扰动词语;根据第一重要性信息,依次得到将待处理语句信息中各个词语替换为对应的扰动词语后的扰动语句信息;在确定扰动语句信息满足预设条件时,根据扰动语句信息得到对待处理语句信息攻击成功后的对抗样本。通过本实施例中的方法可以实现对待处理语句进行词语替换的方式得到对抗样本,进而可以增加用于对预测模型进行训练的样本的多样性,同时可以通过自动生成对抗样本,提升训练数据获取的便利性,提升模型训练的效率。
-
公开(公告)号:CN109783778B
公开(公告)日:2020-10-23
申请号:CN201811577909.8
申请日:2018-12-20
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/194 , G06F40/289
Abstract: 本发明实施例涉及一种文本溯源方法、设备及存储介质,所述方法包括:根据待判定文本和源文本生成词袋模型,所述源文本包括多个文本;利用多种预设的相似度算法,分别对所述词袋模型进行相似度计算,确定在不同相似度算法的情况下,所述源文本中多个文本与所述待判定文本的多个第一相似度排序;基于第一公式和所述第一相似度排序确定所述源文本源文本中多个文本与所述待判定文本的第二相似度排序;基于所述第二相似度排序从所述源文本中选择符合同源条件的文本作为所述待判定文本的同源文本,采用多种相似度的算法,可以弥补单一算法的不足,减少因计算方式不同带来的偶然性,提升计算结果的全面性和准确性。
-
公开(公告)号:CN109614478A
公开(公告)日:2019-04-12
申请号:CN201811552104.8
申请日:2018-12-18
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/332 , G06F17/27
Abstract: 本申请实施例涉及一种词向量模型的构建方法、关键词匹配方法及装置,所述方法包括:选取目标关键词,以及与所述目标关键词对应的一个或多个目标文档数据;基于所述目标关键词从网络上获取与所述目标关键词关联的多个关联文档数据;将所述目标文档数据和符合训练条件的关联文档数据作为训练文本,采用Gensim的Word2vec API对所述训练文本进行训练,得到词向量模型,其中,所述符合训练条件的关联文档数据为:与所述目标文档数据的相似度大于第一阈值的所述关联文档数据。该模型在训练过程中,结合选定的目标文档数据,以及通过目标文档数据再选定关联文档数据中符合训练条件的文档数据,提高了该模型的准确性。
-
公开(公告)号:CN119782520A
公开(公告)日:2025-04-08
申请号:CN202411840116.6
申请日:2024-12-13
Applicant: 北京中科闻歌科技股份有限公司 , 中国科学院自动化研究所 , 航空工业信息中心
IPC: G06F16/34 , G06F16/355 , G06F16/3329 , G06F40/30 , G06N3/045 , G06F18/22
Abstract: 本发明提供了一种基于大语言模型的事件脉络生成方法、设备和介质,包括:事件信息输入及相关数据获取,数据清洗及相关性判断,大模型事件脉络生成,事件脉络清洗及梳理,事件脉络溯源信息溯源。本发明通过大语言模型生成及梳理事件脉络,可保障脉络的逻辑性,使用户更加清晰的浏览事件发生的前因后果。此外,通过使用大语言模型的通用理解能力,无需针对各个领域进行适配性工作。
-
-
-
-
-
-
-
-
-