一种基于目标信息识别的用户生成内容立场检测方法及系统

    公开(公告)号:CN118070774A

    公开(公告)日:2024-05-24

    申请号:CN202410353286.5

    申请日:2024-03-26

    Abstract: 一种基于目标信息识别的用户生成内容立场检测方法及系统,涉及社交网络数据处理技术领域。本发明为了解决现有的用户生成内容立场检测或识别方法需要花费大量人工成本去标注目标信息,并且仅有的类似方法在目标识别阶段往往需要大规模数据对模型进行训练或微调,导致样本数据质量会直接影响目标识别的性能和准确率的问题。技术要点:首先从给定社交媒体文本中抽取出具有代表性的关键词;然后通过余弦相似度计算关键词与目标集合中特定目标之间的相似度,并根据相似度将确定文本所针对的目标对象;最后基于识别出的目标对象,采用多任务BERTweet模型来检测文本与该目标对象之间的立场关系。本发明所提出的基于目标信息识别的用户生成内容立场检测方法可有效减少人工成本,从而提高了立场检测方法在实际应用中的可行性和实用性。

    一种基于多源域适应和强化学习的众包命名实体识别模型及系统

    公开(公告)号:CN117436449A

    公开(公告)日:2024-01-23

    申请号:CN202311442418.3

    申请日:2023-11-01

    Abstract: 一种基于多源域适应和强化学习的众包命名实体识别模型及系统,属于众包命名实体识别技术领域。本发明为了解现有的使用域适应模型解决众包问题的方法往往没有充分考虑标注者的可靠性导致低质量标注者的数据对模型训练产生负面影响、以及现有众包命名实体识别方法在处理低质量标注者提交的极低质量数据时存在困难等问题。通过考虑标注者可靠性生成合成的专家表示,并采用基于强化学习的实例选择器丢弃低质量的标注,从而提高命名实体识别模型在众包数据集上的性能,本发明加深了对众包命名实体识别领域适应方法中标注者可靠性的理解,提出了一种基于强化学习的数据预处理实例选择器,并展示了其在解决众包标注中的命名实体识别挑战方面的有效性。本发明用于在无监督众包数据中高效地提取命名实体信息。

    一种两级阈值攻击检测方法、计算机及存储介质

    公开(公告)号:CN113760664A

    公开(公告)日:2021-12-07

    申请号:CN202111060878.0

    申请日:2021-09-10

    Abstract: 本发明提出一种两级阈值攻击检测方法、计算机及存储介质,属于智能检测技术领域。基于I级和II级的两级阈值攻击检测方法,首先,重构模式匹配算法自动机,选择≥4层的所有节点,为每个选择的节点增加被访问次数t、I级阈值L1和II级阈值L2后执行下一步骤,其次,自动机接收待匹配数据T,将I级阈值L1阈值节点比例p1和II级阈值L2阈值节点比例p2设置为0,匹配指针指向T的首字符,执行下一步骤,最后,统计节点访问次数;判断节点访问次数是否超过I级阈值L1和II级阈值L2阈值节点比例p1和节点比例p2,访问次数超过阈值的判定为攻击。解决现有技术无法识别攻击数据DPI系统收到攻击技术问题。

    一种适用于缓存丢失攻击的自定义位置顺序模式匹配算法

    公开(公告)号:CN113010882A

    公开(公告)日:2021-06-22

    申请号:CN202110292042.7

    申请日:2021-03-18

    Abstract: 本发明提出了一种适用于缓存丢失攻击的自定义位置顺序模式匹配算法,涉及一种匹配算法,尤其涉及一种适用于缓存丢失攻击的自定义位置顺序模式匹配算法,通过建立自定义位置顺序的自动机,将当前扫描字符与当前状态节点进行匹配;当前扫描字符与当前状态节点边值或失败指针中的chr匹配成功,自动机沿着边或失败指针跳转到下一个节点,如果新节点为模式自定义顺序的尾节点,即自动机的叶子节点,命中模式,输出OUTPUT表中记录的模式,自动机当前状态跳转到当前节点记录的下一个节点,继续扫描匹配;自定义位置顺序匹配算法解决了模式匹配算法总是向深度扫描,因大量自动机节点不在CPU缓存内,造成缓存命中率低,系统处理性能大幅下降的问题。

    一种基于规范化张量分解的司法案例建模方法、装置及存储介质

    公开(公告)号:CN112883938A

    公开(公告)日:2021-06-01

    申请号:CN202110379085.9

    申请日:2021-04-08

    Abstract: 本发明提出了一种基于规范化张量分解的司法案例建模方法,涉及一种司法案例建模方法,尤其涉及一种基于规范化张量分解的司法案例建模方法,属于数据处理技术领域。包括以下步骤:步骤一.将司法案例进行模块分割;步骤二.将司法案例模块中的词汇过滤;步骤三.将司法案例模块矩阵化及张量生成;步骤四.将司法案例的原始张量分解为核张量,完成司法案例建模。解决了现有技术中存在的天然缺陷,不利于提高后续预测算法的准确率的技术问题,实现了无需大量的法律专业知识和人工标注工作,对数据库中词汇和语法信息的依赖性不强,能从各个层面描述司法案例,捕捉不同案例模块间的潜在关联,提高后续案例相关预测算法准确率。

    基于Xen的虚拟机部署系统及方法

    公开(公告)号:CN104636189B

    公开(公告)日:2018-03-30

    申请号:CN201510087347.9

    申请日:2015-02-25

    Abstract: 基于Xen的虚拟机部署系统及方法,属于虚拟机快速部署系统领域。现有的Xen虚拟机快速部署系统无法应用于大规模云环境需求,并且无法动态改变虚拟机的软件环境和IP地址的问题。本发明根据用户需求,采用JSP网页服务器、Tomcat网页服务器、MySQL数据库的组合作为前端系统的前端和管理系统,前端服务器与用户交互,并根据交互获得的用户需求的配置参数信息,采用Libvirt控制库的通信形式向负载服务器发出不同指令,前端系统选取镜像模板库中的增量镜像采用增量虚拟机的部署方式一键化部署不同操作系统、一键化部署不同应用的虚拟机;根据用户需求信息自动化配置虚拟机IP地址;基于部署的不同操作系统、部署的不同应用的虚拟机,能够让用户控制虚拟机的生命周期;还能够动态改变虚拟机的软件环境。

Patent Agency Ranking