新迁入企业税前税源管理方法、装置、设备及存储介质

    公开(公告)号:CN115713427A

    公开(公告)日:2023-02-24

    申请号:CN202211408253.3

    申请日:2022-11-10

    Abstract: 本公开涉及一种新迁入企业税前税源管理方法、装置、设备及存储介质。本公开实施例,通过获取新迁入企业的第一经营纳税数据以及与新迁入企业存在关联关系的其他企业的第二经营纳税数据;对第一经营纳税数据进行特征提取处理,得到新迁入企业的纳税异常特征向量;确定各关联关系对应的新迁入企业所属的企业社区以及社区特征向量;基于纳税异常特征向量和社区特征向量得到新迁入企业对应的税前监控特征向量;将税前监控特征向量输入预设的新迁入企业税前监控模型,基于企业税前监控模型对新迁入企业进行税前监控,可以在海量新迁入企业的税前税源管理中对异常新迁入企业进行精准稳定地的识别与预警,提高对异常税源预警响应的时效性和准确性。

    小语种文本数据的情感判别方法、装置、设备和存储介质

    公开(公告)号:CN113536802A

    公开(公告)日:2021-10-22

    申请号:CN202010319243.7

    申请日:2020-04-21

    Abstract: 本申请涉及一种小语种文本数据的情感判别方法、装置、设备和存储介质。所述方法包括:获取文本数据;提取文本数据的多个文本特征;将文本特征输入支持向量机模型,得到文本数据的第一评价特征;将文本数据输入mBERT模型,得到文本数据的第二评价特征;输入第一评价特征和第二评价特征至情感判别器,输出文本数据的情感判别结果。支持向量机模型所采用的语言本身的特征进行判别时,可以提高对不同语言的情感判别准确度,采用mBERT学习不同语言深度语义向量进行的不同语言情感判别,可以很好的提升模型判别的泛化能力。

    文本溯源方法、设备及存储介质

    公开(公告)号:CN109783778B

    公开(公告)日:2020-10-23

    申请号:CN201811577909.8

    申请日:2018-12-20

    Abstract: 本发明实施例涉及一种文本溯源方法、设备及存储介质,所述方法包括:根据待判定文本和源文本生成词袋模型,所述源文本包括多个文本;利用多种预设的相似度算法,分别对所述词袋模型进行相似度计算,确定在不同相似度算法的情况下,所述源文本中多个文本与所述待判定文本的多个第一相似度排序;基于第一公式和所述第一相似度排序确定所述源文本源文本中多个文本与所述待判定文本的第二相似度排序;基于所述第二相似度排序从所述源文本中选择符合同源条件的文本作为所述待判定文本的同源文本,采用多种相似度的算法,可以弥补单一算法的不足,减少因计算方式不同带来的偶然性,提升计算结果的全面性和准确性。

    词向量模型的构建方法、关键词匹配方法及装置

    公开(公告)号:CN109614478A

    公开(公告)日:2019-04-12

    申请号:CN201811552104.8

    申请日:2018-12-18

    Abstract: 本申请实施例涉及一种词向量模型的构建方法、关键词匹配方法及装置,所述方法包括:选取目标关键词,以及与所述目标关键词对应的一个或多个目标文档数据;基于所述目标关键词从网络上获取与所述目标关键词关联的多个关联文档数据;将所述目标文档数据和符合训练条件的关联文档数据作为训练文本,采用Gensim的Word2vec API对所述训练文本进行训练,得到词向量模型,其中,所述符合训练条件的关联文档数据为:与所述目标文档数据的相似度大于第一阈值的所述关联文档数据。该模型在训练过程中,结合选定的目标文档数据,以及通过目标文档数据再选定关联文档数据中符合训练条件的文档数据,提高了该模型的准确性。

Patent Agency Ranking