基于联邦泛化数据处理方法、系统、计算设备及存储介质

    公开(公告)号:CN116628497A

    公开(公告)日:2023-08-22

    申请号:CN202310583452.6

    申请日:2023-05-23

    Abstract: 本发明公开了一种基于联邦泛化数据处理方法、系统、计算设备及存储介质,所述方法包括:基于联邦对比学习进行数据建模,将数据样本标记为异常样本和正常样本的不同类别,每个本地模型在其本地数据集上进行联邦检测任务的迭代训练,并逐步更新其自己的参数;本地更新后,在可信的中央服务器聚合所有参与联邦检测任务的本地模型的参数,经过计算后聚合形成一个全局模型,然后服务器将所述全局模型分发给参与的终端,进行下次迭代训练。本发明实现在“数据孤岛”状态下对于样本的充分学习和利用,基于对比学习技术,拉近正常样本之间的距离,拉远异常样本距离,从而实现在保护隐私的前提下,对数据的建模,并为异常检测打下基础。

    一种中文微博主客观句分类方法

    公开(公告)号:CN106055633A

    公开(公告)日:2016-10-26

    申请号:CN201610367978.0

    申请日:2016-05-30

    CPC classification number: G06F16/35 G06K9/6256 G06K9/6269

    Abstract: 本发明提出了一种中文微博主客观句分类方法,所述方法包括:根据预设的主观句训练语料集和客观句训练语料集形成如下的六个特征集:3‑POS主观模式特征集、句法依存关系特征集、情感词特征集、情感影响因子特征集、语气词及标点符号特征集、字数及链接特征集;根据所述六个特征集,利用支持向量机SVM算法,形成中文微博主客观句分类模型,以利用所述中文微博主客观句分类模型对待测试语句进行主客观句分类。所述方法不但考虑了中文文本的语言学特点,同时也充分利用微博的个性化特征,使得本文所选取的特征更加接近微博本身的语义描述。

    一种针对隧道流量的关联方法和装置

    公开(公告)号:CN117768343B

    公开(公告)日:2024-08-30

    申请号:CN202311587718.0

    申请日:2023-11-24

    Abstract: 本发明提供一种针对隧道流量的关联方法和装置,其中所述方法包括:获取预建立的网络隧道的多个入口节点流和多个出口节点流;确定与每个出口节点流对应的候选入口节点流,分别计算多个候选入口节点流的累计传输量距离;将每个出口节点流输入至自编码网络,输出对应的映射入口节点流,分别计算映射入口节点流和多个候选入口节点流的降噪距离;将多个候选入口节点流输入至优化表示生成器,分别输出多个候选入口节点流之间的优化表示距离;根据多个候选入口节点流的累计传输量距离、和映射入口节点流的降噪距离以及多个候选入口节点流之间的优化表示距离,对候选入口节点流进行筛选,确定每个出口节点流对应的目标入口节点流。

    一种基于时空行为数据的跨社交网络虚拟用户身份对齐方法

    公开(公告)号:CN112085614A

    公开(公告)日:2020-12-15

    申请号:CN202010778007.1

    申请日:2020-08-05

    Abstract: 一种基于时空行为数据的跨社交网络虚拟用户身份对齐方法,主要步骤为:1)预处理用户在社交网络上产生的时空行为数据,生成用户时空行为序列;2)基于时空行为序列数据定义并计算社交网络间任意两用户的相似度;3)构建以社交网络用户为节点的二部图,相同社交网络用户节点间无边,不同社交网络用户节点间边的权重等于用户相似度;4)计算二部图的最大权匹配;5)基于最大权匹配结果生成虚拟身份对齐结果。本发明能够为全方位分析用户在社交网络中扮演的角色、准确估计用户真实属性提供重要理论基础与技术支撑,所需要数据在现实社交网络中易于获取,计算过程易于通过分布式框架进行,可以在大规模复杂网络中快速做到虚拟用户身份对齐。

Patent Agency Ranking