一种基于多粒度融合与Bert筛选的中文文本自动校对方法

    公开(公告)号:CN113221542A

    公开(公告)日:2021-08-06

    申请号:CN202110348599.8

    申请日:2021-03-31

    Abstract: 本发明涉及一种基于多粒度融合与Bert筛选的中文文本自动校对方法,属于自然语言处理技术领域;本发明通过结合字粒度与词粒度级别的校对模型,以期能够利用不同粒度级别的信息。字粒度模型采用集成规则生成候选集与Bert筛选的方法,词粒度采用传统方法,先构建候选集,然后使用N‑Gram模型计算句子困惑度取最佳候选。另外该方法还解决了多字少字等错误类型问题。实验结果验证了该方法能有效提高检错纠错的召回率,有效提升校对模型性能。对比现有技术,本发明规避了字粒度校对模型和词粒度校对模型带来的局限性,基于多粒度融合与Bert筛选通过两种粒度有效结合不同层次信息,通过N‑Gram LM打分与Bert进行筛选,能够有效提高错误的召回率和校对的准确率。

    立场分析方法、装置、电子设备及存储介质

    公开(公告)号:CN118503420A

    公开(公告)日:2024-08-16

    申请号:CN202410583474.7

    申请日:2024-05-11

    Abstract: 本公开涉及一种立场分析方法、装置、电子设备及存储介质。其中,立场分析方法包括:获取待处理文本以及待处理文本对应的词语集合和词语集合中每个词语的词频;基于每个词语的词频计算每个词语对应的互信息值,并根据互信息值确定待处理文本对应的多个主题短语;计算多个主题短语与待处理文本之间的关系矩阵;基于关系矩阵对待处理文本的每个主题短语的立场进行分析,得到每个主题短语对应的立场分析结果,由此,能够通过确定多个主题短语与待处理文本之间的关系矩阵,根据关系矩阵对每个主题短语进行立场分析,得到主题短语对应的立场分析结果,避免了立场分析模型难以泛化的问题,提高了待处理文本对应的主题短语的立场分析结果。

    受雇网络写手的识别方法、装置、计算机设备及存储介质

    公开(公告)号:CN118410403A

    公开(公告)日:2024-07-30

    申请号:CN202410654244.5

    申请日:2024-05-24

    Abstract: 本公开涉及互联网信息处理技术领域,尤其涉及受雇网络写手的识别方法、装置、计算机设备及存储介质;方法包括:在获取到网络用户和各网络用户之间的关联关系后,以网络用户为节点,以关联关系为边构建了第一知识图谱,并将第一知识图谱输入至预训练的图神经网络模型中,最终得到各网络用户分别对应的类别标签,完成对网络用户的识别;在利用图神经网络模型对各网络节点进行识别时,将网络节点之间的关联关系以及与各网络节点相邻的节点信息也考虑进去,使得最终得到的类别标签具有更高的准确性,相较于当前仅根据用户信息对网络用户进行识别的方式,根据本方案识别方法得到的识别结果具有更强的说服力。

    可解释性的社交机器人检测方法、装置、设备及存储介质

    公开(公告)号:CN116992300A

    公开(公告)日:2023-11-03

    申请号:CN202310538489.7

    申请日:2023-05-12

    Abstract: 本公开涉及一种可解释性的社交机器人检测方法、装置、设备及存储介质。本公开通过获取社交图中各用户节点的节点特征向量以及不同用户节点之间构成的边的权重,针对待解释节点,通过领域聚合得到待解释节点的嵌入向量,进而通过社交机器人检测模型对待解释节点的嵌入向量进行处理,以预测待解释节点为社交机器人的第一概率;从而基于第一概率,可以确定社交图中任一用户节点对待解释节点的预测结果的节点贡献度,表示任一用户节点对于待解释节点预测结果的影响程度,并且可以确定待解释节点的嵌入向量中的任一特征对待解释节点的预测结果的特征贡献度,表示任一特征对于待解释节点预测结果的影响程度,解决社交机器人检测的解释性差的问题。

Patent Agency Ranking