一种基于深度学习的表格数据异常检测方法及系统

    公开(公告)号:CN117932517A

    公开(公告)日:2024-04-26

    申请号:CN202410118648.2

    申请日:2024-01-29

    Abstract: 本发明公开了一种基于深度学习的表格数据异常检测方法及系统,涉及数据检测领域。本发明包括以下步骤:获取待检测数据,并输入掩码生成器中,输出多个掩码矩阵;将每个掩码矩阵与原始数据执行元素乘积,生成多个掩码;将多个掩码输入重构网络,将掩码输入映射到潜在空间的特征表示,并将特征从潜在空间重新映射到原始空间,进而输出与输入相匹配的重构数据;分别计算掩码与重构数据的重构误差,使用平均重构误差作为异常分数,将异常分数高于正常样本的待检测数据判为异常数据。本发明具备较强的泛化能力,能够成功扩展至其他形式的大数据异常检测任务。

    一种图数据库的创建方法、企业数据查询方法及装置

    公开(公告)号:CN111241347A

    公开(公告)日:2020-06-05

    申请号:CN201911395892.9

    申请日:2019-12-30

    Abstract: 本发明实施例提供了一种图数据库的创建方法、企业数据查询方法及装置,包括:获取待查询的企业信息;从图数据库中查询与表示待查询企业的第一类节点存在连接关系的第一类节点和第二类节点,作为关联第一类节点和关联第二类节点;查询待查询企业所属的企业社区包含的企业;展示表示待查询企业的节点,关联第一类节点和关联第二类节点,以及上述企业社区包含的节点。应用本发明实施例提供的方案,可以查询到与待查询企业存在交易关系的企业以及存在控制关系的自然人,还可以查询到待查询企业所属的企业社区包含的企业,可以直观反映出企业之间的交易关系,以及企业和自然人之间的控制关系,以及与待查询企业存在合作关系的企业,丰富了查询结果。

    发票类别识别方法、装置、电子设备及可读存储介质

    公开(公告)号:CN110009796A

    公开(公告)日:2019-07-12

    申请号:CN201910290457.3

    申请日:2019-04-11

    Abstract: 本发明实施例提供了一种发票类别识别方法、装置、电子设备及可读存储介质,应用于数据挖掘技术领域,所述方法包括:获取用户输入的针对待识别发票的发票信息,根据发票信息中的关键词以及预先获取的发票样本训练集,确定待识别发票所属的发票编码集合;针对发票编码集合中的每个发票编码,根据关键词以及发票样本训练集,通过朴素贝叶斯算法,计算待识别发票属于该发票编码的后验概率值;将最大后验概率值对应的发票编码作为待识别发票的发票编码。与现有技术相比,本发明可以提高发票类别识别的效率。

    发票类别识别方法、装置、电子设备及可读存储介质

    公开(公告)号:CN109740642A

    公开(公告)日:2019-05-10

    申请号:CN201811555038.X

    申请日:2018-12-19

    Abstract: 本发明实施例提供了一种发票类别识别方法、装置、电子设备及可读存储介质,应用于数据挖掘技术领域,所述方法包括:提取待识别发票中的关键信息,对关键信息中的每个词进行向量表示,得到关键信息矩阵;将关键信息矩阵输入预先建立的神经网络模型中,得到关键信息矩阵对应的分类概率向量,神经网络模型是根据各发票中的关键信息以及各发票对应的分类编码得到的;将分类概率向量中最大值元素对应的分类编码作为待识别发票的分类编码。与现有技术相比,本发明可以提高发票类别识别的效率和准确性。

    一种数据查询方法及装置

    公开(公告)号:CN110413665A

    公开(公告)日:2019-11-05

    申请号:CN201910586489.8

    申请日:2019-07-01

    Abstract: 本发明实施例提供了一种数据查询方法及装置,涉及数据处理技术领域,其中,上述方法包括:获得纳税方信息;在图数据库中查询包含所获得的纳税方信息的关系图,得到第一关系图,其中,所述图数据库用于存储各个纳税方与开票项之间的关系图;获得所述第一关系图中包含的开票项信息;在所述图数据库中查询包含所获得的开票项信息的关系图,作为查询结果。应用本发明实施例提供的方案进行数据查询,能够获得更丰富的查询结果。

    一种数据存储方法及装置

    公开(公告)号:CN109558399B

    公开(公告)日:2021-06-29

    申请号:CN201811400598.8

    申请日:2018-11-22

    Abstract: 本发明实施例公开了一种数据存储方法及装置,涉及数据处理技术领域。其中,包括:对待存储发票数据进行数据清洗,清洗掉所述待存储发票数据中的干扰数据;确定清洗后待存储发票数据中的纳税方、负税方以及纳税方和负税方之间的发票流数据;在用于存储数据的图数据库中确定纳税方对应的第一节点和负税方对应的第二节点;在图数据库中建立第一节点与第二节点之间的关联关系;按照关联关系将所述发票流数据导入图数据库中,实现待存储发票数据的存储。应用本发明实施例提供的方案时,在面对海量数据存储的情况下,能够满足用户对数据读写等方面的需求。

    发票类别识别方法、装置、电子设备及可读存储介质

    公开(公告)号:CN110009796B

    公开(公告)日:2020-12-04

    申请号:CN201910290457.3

    申请日:2019-04-11

    Abstract: 本发明实施例提供了一种发票类别识别方法、装置、电子设备及可读存储介质,应用于数据挖掘技术领域,所述方法包括:获取用户输入的针对待识别发票的发票信息,根据发票信息中的关键词以及预先获取的发票样本训练集,确定待识别发票所属的发票编码集合;针对发票编码集合中的每个发票编码,根据关键词以及发票样本训练集,通过朴素贝叶斯算法,计算待识别发票属于该发票编码的后验概率值;将最大后验概率值对应的发票编码作为待识别发票的发票编码。与现有技术相比,本发明可以提高发票类别识别的效率。

    一种多模态的用户心智感知问答模型的构建方法

    公开(公告)号:CN117033602B

    公开(公告)日:2024-11-26

    申请号:CN202311071584.7

    申请日:2023-08-24

    Abstract: 本发明公开了一种多模态的用户心智感知问答模型的构建方法,涉及多模态智能问答技术领域。包括构建信息融合模块、构建基于强化学习的策略网络、构建基于问题相似度的用户反馈模块。本发明在模型中引入场景图形式的视觉信息,能够有效融合多轮对话历史信息及图像场景图信息,使得模型能够获取到图像语义级别的信息,场景图的结构化数据形式也增强了模型推理的可解释性;并且提出的基于问题相似度的用户反馈获取方法为模型引入了用户反馈信号,相较于传统问答模型能够更智能地推测出用户对于答案的反馈,利用该反馈可以引导模型后续的策略网络训练,使模型的推理向更靠近用户心智的方向进行,为用户提供更好的人机服务体验。

    一种基于记忆网络的半监督异常检测方法和装置

    公开(公告)号:CN118152853A

    公开(公告)日:2024-06-07

    申请号:CN202410242238.9

    申请日:2024-03-04

    Abstract: 本发明提供了一种基于记忆网络的半监督异常检测方法和装置,包括:构建包括自编码器和记忆模块的掩码记忆网络MMNet;将检测数据输入自编码器进行编码,获得编码后检测数据的数据特征;基于所述数据特征,在所述记忆模块中的每个记忆项中进行寻址,获得所述数据特征对应的注意力权重;根据所述注意力权重对每个记忆项加权计算,获得注意力加权特征维度;将所述注意力加权特征维度输入所述掩码记忆网络MMNet的解码器,获得重构后的检测数据;通过基于软屏蔽策略的异常评分约束,计算所述检测数据的异常分数,根据所述异常分数,判别所述检测数据的异常。提高了异常数据的检测效率。

Patent Agency Ranking