基于遮挡语言模型的文本纠错方法、系统、设备及介质

    公开(公告)号:CN117391072A

    公开(公告)日:2024-01-12

    申请号:CN202311173762.7

    申请日:2023-09-12

    摘要: 本发明提供了一种基于遮挡语言模型的文本纠错方法、系统、设备及介质,能够通过无监督学习大量语料文本的方式,完成对文本的智能纠错,不需要人工标记的大量语料。本发明在不需要准备专门的平行语料的情况下完成中文文本纠错的任务,只需要提供大量中文语言的文本给语言模型自动进行训练即可,采用无监督学习大量语言文本的方式拓展了平行语料范围有限造成的局限性,不需要人工标记的大量语料。本发明采用遮挡语言模型的方式进行文本纠错,其过程中通过无监督学习大量语料文本的方式,完成对文本的智能纠错,应用于针对中文文本纠错的系统中,发现并纠错文本中在输入等过程中产生的错误。

    基于图挖掘的电信异常检测方法
    4.
    发明公开

    公开(公告)号:CN116775943A

    公开(公告)日:2023-09-19

    申请号:CN202310498578.3

    申请日:2023-05-06

    摘要: 本发明公开了一种基于图挖掘的电信异常检测方法。克服了现有技术在进行电信异常检测时检测效率低和检测不够精准等问题。检测方法对通联记录数据处理后组织成图,将图由全图划分成一系列子图,进行图表征的局部学习和全局学习,获得节点级别的本地表征和子图级别的全局表征,通过异常检测算法得到每个子图的异常得分,选取异常得分最高的部分子图,通过异常检测算法得到这些子图中每个节点的异常得分,取异常得分最大的部分节点作为最终检测结果输出。此检测方法能实现大规模图中电信异常行为高效准确的检测。

    一种基于频域信息与多任务学习的深度伪造视频鉴别方法

    公开(公告)号:CN115187891A

    公开(公告)日:2022-10-14

    申请号:CN202210585640.8

    申请日:2022-05-27

    摘要: 本发明涉及一种基于频域信息与多任务学习的深度伪造视频鉴别方法,使用频域分析中的离散余弦变换,结合分块处理的方式保留部分RGB三通道图像的空间信息,得到频域特征作为输入数据;使用多任务学习的深度神经网络提取输入数据的特征,将Xception网络作为骨干网络模块,并设计基于反卷积运算的分割模块与基于特征融合的分类模块,将骨干网络模块与分割模块提取的特征融合;同时设计优化训练引导目标算法,将融合后的特征间关系转化为三维条件下的几何距离,通过优化训练引导目标算法完成多任务学习的深度神经网络模型的训练,得到深度伪造视频鉴别模型,完成深度伪造视频的鉴别。

    微博分类方法及装置
    8.
    发明授权

    公开(公告)号:CN104361037B

    公开(公告)日:2017-12-19

    申请号:CN201410591807.7

    申请日:2014-10-29

    IPC分类号: G06F17/30 G06F17/27

    摘要: 本发明公开了一种微博分类方法及装置。该方法包括:步骤1,对训练语料集合进行预处理,对预处理后的训练语料进行分词,获取候选特征,并对候选特征进行权重计算,根据权重计算结果进行特征选择,获取最终的分类特征;步骤2,根据最终的分类特征,采用贝叶斯分类器进行模型训练,获取分类模型;步骤3,采用贝叶斯分类器根据分类模型对微博文档进行分类。借助于本发明的技术方案,提高了分类的召回率与准确率。