一种基于多粒度融合与Bert筛选的中文文本自动校对方法

    公开(公告)号:CN113221542A

    公开(公告)日:2021-08-06

    申请号:CN202110348599.8

    申请日:2021-03-31

    Abstract: 本发明涉及一种基于多粒度融合与Bert筛选的中文文本自动校对方法,属于自然语言处理技术领域;本发明通过结合字粒度与词粒度级别的校对模型,以期能够利用不同粒度级别的信息。字粒度模型采用集成规则生成候选集与Bert筛选的方法,词粒度采用传统方法,先构建候选集,然后使用N‑Gram模型计算句子困惑度取最佳候选。另外该方法还解决了多字少字等错误类型问题。实验结果验证了该方法能有效提高检错纠错的召回率,有效提升校对模型性能。对比现有技术,本发明规避了字粒度校对模型和词粒度校对模型带来的局限性,基于多粒度融合与Bert筛选通过两种粒度有效结合不同层次信息,通过N‑Gram LM打分与Bert进行筛选,能够有效提高错误的召回率和校对的准确率。

    一种实体关系抽取方法、装置、电子设备以及存储介质

    公开(公告)号:CN118657148A

    公开(公告)日:2024-09-17

    申请号:CN202410681340.9

    申请日:2024-05-29

    Abstract: 本发明提供一种实体关系抽取方法、装置、电子设备以及存储介质,涉及人工智能技术领域。实体关系抽取方法包括:利用注意力模型,处理待处理文本以及目标实体关系词,得到实体关系判别信息;利用实体关系判别信息,得到目标第一命名实体与候选第二命名实体在待处理文本中的第一关联度、目标第一命名实体与目标实体关系词在待处理文本中的第二关联度,以及候选第二命名实体与目标实体关系词在待处理文本中的第三关联度;响应于第一关联度、第二关联度以及第三关联度均大于各自对应的预设阈值,从待处理文本中抽取出目标第一命名实体和候选第二命名实体之间的待抽取的实体关系。本发明可以准确、高效地执行实体关系抽取任务。

    基于社交工具的区域数据回溯分析方法及系统

    公开(公告)号:CN116821455A

    公开(公告)日:2023-09-29

    申请号:CN202310511094.8

    申请日:2023-05-08

    Inventor: 张传新 张旭 王鹏

    Abstract: 本发明公开了一种基于社交工具的区域数据回溯分析方法,包括:步骤一,提供一个前端浏览器访问页面,创建区域任务参数,将区域任务转化成json格式存放并进入消息队列;步骤二,实时监听消息队列,解析得到区域任务并分发到各个节点;步骤三,各个节点通过所述区域任务参数对社交工具的区域数据进行回溯获取;步骤四,对获取的每条数据进行分析,包括计算哈希值、提取关键词、标记语言标签;步骤五,以索引的形式将每条数据的分析结果及其原始数据存储入库。本发明还公开了一种基于社交工具的区域数据回溯分析系统,及电子设备和存储介质。本发明通过对特定地理区域的社交工具数据获取,能够实现对获取到的数据结合具体的业务逻辑进行分析。

    基于虚拟设备生成采集资源的方法和系统

    公开(公告)号:CN116782199A

    公开(公告)日:2023-09-19

    申请号:CN202310505748.6

    申请日:2023-05-08

    Inventor: 王鹏 张旭 刘春阳

    Abstract: 本发明公开了一种基于虚拟设备生成采集资源的方法,包括:构建虚拟移动终端设备;基于虚拟移动终端设备的设备信息,利用移动客户端进行注册并生成采集资源;对采集资源进行可用性测试;保存可用的采集资源。本发明通过虚拟移动终端设备生成采集资源,使用生成的采集资源访问移动客户端进行数据采集,使采集的数据与构建的虚拟移动终端设备关联,从而实现特定设备的精准数据采集,同时也可快速收集设备和应用程序的基础信息。其次,由于移动终端设备是虚拟构建的,因此无需购买实体设备,降低了数据采集成本、管理成本和管理复杂度。

    一种社交机器人检测方法、装置、设备及存储介质

    公开(公告)号:CN116720009A

    公开(公告)日:2023-09-08

    申请号:CN202310538132.9

    申请日:2023-05-12

    Inventor: 张旭 刘春阳 解峥

    Abstract: 本公开涉及一种社交机器人检测方法、装置、设备及存储介质。本公开通过获取社交属性数据、推文属性数据和社交行为数据,可以确定用户节点的节点特征向量以及用户节点与其他用户节点之间的关联关系,由于节点特征向量中的每个元素均为用户节点某个维度的特征,因此,节点特征向量从多个维度更加全面地描述了用户节点的特征,而用户节点与其他用户节点之间的关联关系为异构关联关系,异构关联关系可以理解为不同类型的关联关系,包括显性关系和隐性关系,因此,基于用户节点的节点特征向量以及用户节点与其他用户节点之间的关联关系,能够挖掘不同用户账户之间的行为关联性,从而更加有效地识别伪装成真实用户的社交机器人及社交机器人群体。

    综合多模型的网络热点话题传播模式分类方法及系统

    公开(公告)号:CN116467454A

    公开(公告)日:2023-07-21

    申请号:CN202310504562.9

    申请日:2023-05-06

    Abstract: 本发明公开了一种综合多模型的网络热点话题传播模式分类方法,其包括以下步骤:步骤一、收集平台t时间段内的目标热点话题的帖子数据;步骤二、基于帖子数据计算帖子基本维度信息;步骤三、绘制关于时间‑帖子数量的话题热度变化曲线;步骤四、提取目标热点话题的竞争性话题,并计算竞争性话题数量;步骤五、基于帖子数据,量化目标热点话题的传播角色的信息;步骤六、通过漏斗模型和网络模型,进行目标热点话题的传播模式识别分类。本发明构建了一种普适的网络热点话题传播模式识别分类方法,能够有效地判断话题的传播类型,即使在话题部分维度数据缺失的情况下仍然具有较好的分类结果。

Patent Agency Ranking