基于特征工程和表示学习的机器行为识别方法

    公开(公告)号:CN113608946B

    公开(公告)日:2023-09-12

    申请号:CN202110910834.6

    申请日:2021-08-10

    摘要: 基于特征工程和表示学习的机器行为识别方法,由三个步骤构成:步骤一,对大数据进行分析,通过时间、频次等多维度的信息,建立3σ模型,用于确定机器行为的访问时间频段,在机器行为的访问时间频段下,通过分组聚合等方式,归纳总结提取出基于机器行为的特征;步骤二,并通过查阅API文档、软件模拟复现、官方的RFC文档等方式对行为进行定义和命名,整合成一组完备的机器行为特征,完成基于特征工程机器行为识别工作;步骤三,对识别效果不佳的模型加入与其他行为存在交集的特征,去排除其他行为,以提高准确率。

    基于遮挡语言模型的文本纠错方法、系统、设备及介质

    公开(公告)号:CN117391072A

    公开(公告)日:2024-01-12

    申请号:CN202311173762.7

    申请日:2023-09-12

    摘要: 本发明提供了一种基于遮挡语言模型的文本纠错方法、系统、设备及介质,能够通过无监督学习大量语料文本的方式,完成对文本的智能纠错,不需要人工标记的大量语料。本发明在不需要准备专门的平行语料的情况下完成中文文本纠错的任务,只需要提供大量中文语言的文本给语言模型自动进行训练即可,采用无监督学习大量语言文本的方式拓展了平行语料范围有限造成的局限性,不需要人工标记的大量语料。本发明采用遮挡语言模型的方式进行文本纠错,其过程中通过无监督学习大量语料文本的方式,完成对文本的智能纠错,应用于针对中文文本纠错的系统中,发现并纠错文本中在输入等过程中产生的错误。

    基于特征工程和表示学习的机器行为识别方法

    公开(公告)号:CN113608946A

    公开(公告)日:2021-11-05

    申请号:CN202110910834.6

    申请日:2021-08-10

    摘要: 基于特征工程和表示学习的机器行为识别方法,由三个步骤构成:步骤一,对大数据进行分析,通过时间、频次等多维度的信息,建立3σ模型,用于确定机器行为的访问时间频段,在机器行为的访问时间频段下,通过分组聚合等方式,归纳总结提取出基于机器行为的特征;步骤二,并通过查阅API文档、软件模拟复现、官方的RFC文档等方式对行为进行定义和命名,整合成一组完备的机器行为特征,完成基于特征工程机器行为识别工作;步骤三,对识别效果不佳的模型加入与其他行为存在交集的特征,去排除其他行为,以提高准确率。

    一种从微信中发现特定领域微信公众号的方法

    公开(公告)号:CN109284431A

    公开(公告)日:2019-01-29

    申请号:CN201810901757.6

    申请日:2018-08-09

    IPC分类号: G06F16/953 G06F16/958

    摘要: 本发明涉及一种从微信中发现特定领域微信公众号的方涉,属于数据挖掘技术领域。所述方法包括:关联已知特定领域微信公众号的账号主体、搜索微信公众号的账号信息和文章信息,生成候选特定领域微信公众号列表,利用构建的待发现特定领域文章分类模型对其文章信息进行判断,确保其文章内容和特定领域相关,完成从微信中发现特定领域微信公众号。本发明方法解决了微信公众号账号信息和文章内容不符的问题,扩展了待发现目标的来源,且在初始配置后自循环发现,不需要长期人工干预,从而有效提高特定领域微信公众号发现的准确性、全面性和自增长性。