一种基于混合比例估计的企业进销项税收风险预测方法

    公开(公告)号:CN116011623A

    公开(公告)日:2023-04-25

    申请号:CN202211610983.1

    申请日:2022-12-12

    摘要: 一种基于混合比例估计的企业进销项税收风险预测方法,包括:根据进销项发票关联企业,提取企业的文本和非文本信息,对文本信息进行文本嵌入编码,对非文本信息编码,两者合并得到企业特征编码;改进现有的MPE方法,估计税收异常企业的先验概率,得到将税收异常和税收正常企业后验概率转化为标注税收异常和未标注企业后验概率的转移矩阵;构建企业税收风险预测网络并基于转移矩阵将网络的输出映射为标注税收异常企业和未标注企业后验概率,在转移矩阵固定的情况下,基于标注税收异常企业样本和未标注企业样本初始化网络参数;估计得到的转移矩阵,并联合优化学习松弛变量和网络参数,将优化后的网络作为最终的预测模型,实现企业税收风险预测。

    一种虚拟机磁盘在线迁移去冗余方法

    公开(公告)号:CN111580932B

    公开(公告)日:2023-04-07

    申请号:CN202010397985.1

    申请日:2020-05-12

    摘要: 本发明公开了一种虚拟机磁盘在线迁移去冗余方法,包括:首先,根据文件系统组织方式,读取磁盘中的超级块,然后根据超级块中的块组描述信息,读取每个块组中的位图,并确定该位图记录块组中的每个块是已用还是可用,利用获取到的所有块组的位图为整个磁盘构建完整的位图;其次,在虚拟机迁移过程中,根据得到的磁盘使用信息进行磁盘迁移,此时只传输已用磁盘块;再次,使用虚拟机自省技术从原始内存数据中提取可能更新过的未使用的块位图,在获取了所有块设备元数据在内存中的缓存后,用其更新位图信息并将之前未迁移的已用磁盘块用现有方法迁移至目的端。本发明主要利用数据自身的语义信息进行数据压缩,从而引入非常小的对上层应用的开销。

    一种偷漏税识别渗透测试方法
    3.
    发明公开

    公开(公告)号:CN115631021A

    公开(公告)日:2023-01-20

    申请号:CN202211414613.0

    申请日:2022-11-11

    IPC分类号: G06Q40/00 G06N3/04 G06N3/08

    摘要: 本发明公开了一种偷漏税识别渗透测试方法,包括:模拟偷漏税公司个体作案在交易网络中发生虚假交易和隐匿交易的行为,生成使偷漏税检测模型对单个虚开企业检测失败的图对抗样本,对检测模型进行局部测试,计算错误识别率;模拟偷漏税公司团伙作案在交易网络中发生虚假交易和隐匿交易的行为,生成降低检测模型对多个虚开企业的整体检测性能的图对抗样本,对检测模型进行全局测试,计算性能降幅;综合局部测试的错误识别率和全局测试的性能降幅,来全面地评估模型在实际偷漏税识别场景中应用的安全性。本发明实现了评估这些偷漏税识别方法的安全性,诊断这些方法是否存在漏洞,从而保证在要求高安全性的税务场景下应用这些偷漏税识别方法的安全性。

    一种基于自动编码机的在线学习潜在退出者预测方法

    公开(公告)号:CN113077100B

    公开(公告)日:2024-10-01

    申请号:CN202110409484.5

    申请日:2021-04-16

    IPC分类号: G06F17/00

    摘要: 本发明公开了一种基于自动编码机的在线学习潜在退出者预测方法,包括:首先,将学习平台学习日志数据中的文本和非文本信息并进行预处理;其次,构建符合潜在退出者检测问题的深层网络结构,依据编码处理后数据的特征维数确定网络的输入、输出层的神经元个数;再次,基于所构建的深层网络结构,采用BP训练策略通过交叉验证训练在线学习潜在退出者检测网络;最后,利用网络的重构误差对学习者进行异常检测,识别出潜在退出者。本发明利用在线学习者的行为判断在线学习者的学习状态发现潜在退出者,为学生提供有效帮助与指导。

    一种基于矩阵分解的税务数据安全图神经网络训练方法

    公开(公告)号:CN116861152A

    公开(公告)日:2023-10-10

    申请号:CN202310795131.2

    申请日:2023-06-30

    摘要: 本发明一种基于矩阵分解的税务数据安全图神经网络训练方法,包括:首先,对税务数据图的邻接矩阵部分利用外部服务器进行安全的特征值分解,并将获得的特征值分解结果分成多个部分,与特征向量矩阵做运算,生成多个可分发的邻接矩阵;其次,对税务数据图的特征矩阵部分,进行差分隐私;再次,税务数据拥有着通过参数服务器将分解后的邻接矩阵与差分隐私后的特征矩阵分发给各计算方进行模型训练;最后,计算方将计算结果返回给税务数据拥有者,经过参数服务器整合更新获得目标模型参数。本发明拓扑秘密分享及邻接矩阵特征值分解的方式,将原始税务数据进行了安全的分解,进而借助外部算力资源实现了对税务数据的高效分析建模,提高了分析效率。

    一种基于自动编码机的在线学习潜在退出者预测方法

    公开(公告)号:CN113077100A

    公开(公告)日:2021-07-06

    申请号:CN202110409484.5

    申请日:2021-04-16

    摘要: 本发明公开了一种基于自动编码机的在线学习潜在退出者预测方法,包括:首先,将学习平台学习日志数据中的文本和非文本信息并进行预处理;其次,构建符合潜在退出者检测问题的深层网络结构,依据编码处理后数据的特征维数确定网络的输入、输出层的神经元个数;再次,基于所构建的深层网络结构,采用BP训练策略通过交叉验证训练在线学习潜在退出者检测网络;最后,利用网络的重构误差对学习者进行异常检测,识别出潜在退出者。本发明利用在线学习者的行为判断在线学习者的学习状态发现潜在退出者,为学生提供有效帮助与指导。

    一种基于噪声标签学习的纳税人行业分类方法

    公开(公告)号:CN112765358A

    公开(公告)日:2021-05-07

    申请号:CN202110201214.5

    申请日:2021-02-23

    摘要: 一种基于噪声标签学习的纳税人行业分类方法,首先,提取纳税人行业信息中待挖掘的文本信息进行文本嵌入,并对嵌入后的信息做特征处理;其次,提取纳税人行业信息中的非文本信息进行编码处理;再次,构建符合纳税人行业分类问题的BERT‑CNN深层网络结构,依据处理后的特征信息和目标类别数来确定网络的层数、每层的神经元个数以及输入输出的维度;然后,依次通过对比学习、最近邻的语义聚类及自标签学习对构建的网络进行预训练;最后,在所构建的深层网络基础上增加一个噪声建模层,通过网络的自信任以及噪声标签信息对噪声分布进行建模,并基于噪声标签数据进行模型训练;最终,将噪声建模层前的深层网络作为分类模型,基于此模型进行纳税人行业分类。

    一种面向复杂税务数据系统的介区域识别方法

    公开(公告)号:CN115496570A

    公开(公告)日:2022-12-20

    申请号:CN202211311742.7

    申请日:2022-10-25

    摘要: 本发明公开了一种面向复杂动态网络的层次划分和介区域识别方法,包括:首先,通过“静态快照构建‑动态时序嵌入”两阶段的方法,将复杂数据系统转化为语义等价的,包含对象、关系、属性和时序等要素的复杂动态网络;其次,基于系统科学中绝热消去原理,识别所关注的子系统随动态网络演化的主导因素,在此基础上构建边界尺度的假设空间;再次,基于频繁子图挖掘算法,挖掘各边界尺度的子图实例中的Motif;最后,基于二进制向量编码构建各边界尺度的相关度矩阵,再基于条件概率对边界尺度层级耦合关系建模,辨识子图模式层级耦合,通过置信度阈值判定两假设空间之间是否存在介区域。

    一种基于硬件加速的虚拟机在线迁移方法

    公开(公告)号:CN111580933B

    公开(公告)日:2022-12-09

    申请号:CN202010398980.0

    申请日:2020-05-12

    IPC分类号: G06F9/455 G06F9/48 G06F9/50

    摘要: 本发明公开了一种基于硬件加速的虚拟机在线迁移方法,该方法包括:首先,分析不同负载对不同迁移模型的性能影响,利用得到的结论提出了对迁移性能进行优化的两个基本策略,即针对不同的负载使用不同的迁移模型的策略和负载感知的预拷贝迁移策略,在此之上提出了一套完整的高效的、能根据工作集负载类型自适应地选择有利的迁移模型的虚拟机迁移方法;其次,提出了在负载分析中使用硬件虚拟化扩展功能进行加速,实现更高效的内存写入访问序列跟踪;再次,提出了开销和性能更优的CLOCK+算法来预测内存写入工作集。本发明通过准确地感知并识别上层负载的工作集信息,并根据工作集负载类型,自适应地选择有利的迁移模型,从而尽可能地减少迁移中性能影响。

    一种基于上下文感知的系统异常检测方法

    公开(公告)号:CN112202726B

    公开(公告)日:2021-11-19

    申请号:CN202010948293.1

    申请日:2020-09-10

    IPC分类号: H04L29/06 G06N3/04 G06N3/08

    摘要: 本发明公开了一种基于上下文感知的系统异常检测方法,该方法结合长短期记忆神经网络构建异常检测模型,实现对系统异常行为的检测。本方法从在系统运行时从系统堆栈信息中获取系统调用的上下文信息,构建上下文信息列表,然后截取训练数据中固定长度的系统行为序列,使用词嵌入向量进行状态压缩并且使用长短期记忆神经网络搭建异常检测模型,训练异常检测模型后便可以实现系统异常调用序列的检测。本发明还通过调整参数进行误报率控制,并且通过收集误报的检测结果,进行在线模型更新进行参数的调整以优化模型,实现了高效精确的系统异常检测。