一种面向多敏感属性数据发布的匿名隐私保护方法

    公开(公告)号:CN110659513B

    公开(公告)日:2022-12-06

    申请号:CN201910933708.5

    申请日:2019-09-29

    Abstract: 本发明公开了一种面向多敏感属性数据发布的匿名隐私保护方法。步骤1:计算原始数据表中各属性间的相关性,定义属性类别;步骤2:根据属性间的相关性,将所有属性进行分组;步骤3:将每个分组按照属性间相关性大小,由高到低排序;步骤4:计算每组内,敏感属性值出现频率,判断属性值是否需要保护;步骤5:将需要保护的敏感属性值及其关联属性与无需保护的敏感属性值进行交换;步骤6:对相关属性进行频繁项集挖掘;步骤7:使用聚类技术生成匿名等价组,匿名等价组内每个敏感属性满足L多样性。本发明通过降低匿名率,关联属性共同置换,在保证隐私保护强度的同时,提高数据的可用性。

    一种融合多粒度信息的中文命名实体识别方法、设备和介质

    公开(公告)号:CN114781380A

    公开(公告)日:2022-07-22

    申请号:CN202210277553.6

    申请日:2022-03-21

    Abstract: 本发明提出一种融合多粒度信息的中文命名实体识别方法、设备和介质。所述方法步骤如下:(1)获取领域语料数据集,将数据集进行预处理并分为训练集、测试集、验证集;(2)提取(1)预处理后的语料数据中字符、软词、部首级预训练向量并进行融合;(3)构建融合多粒度信息的中文命名实体识别模型;(4)将(2)所得的数据输入到模型中进行训练;(5)利用(4)所得的识别模型对待识别数据进行处理与计算,得到命名实体识别结果。本发明针对中文命名实体识别存在的不足,通过融合部首级信息利用序列中字符内部固有的语义信息,利用扩展的软词模块获取了词级别的语义信息,将两者融入到字符嵌入向量中,提高了中文命名实体识别的精度。

    基于Bert-LSTM的文本多特征分类方法及装置

    公开(公告)号:CN114547303A

    公开(公告)日:2022-05-27

    申请号:CN202210165299.0

    申请日:2022-02-18

    Abstract: 本发明公开了一种基于Bert‑LSTM的文本多特征分类方法及装置,属于文本分类技术领域,其中,该方法包括:确定待分类文本数据集,并划分为训练集和测试集;构建基于Bert‑LSTM的文本多特征分类模型;利用训练集对文本多特征分类模型进行训练,得到最优文本多特征分类模型;将待分类文本数据输入最优文本多特征分类模型中,计算待分类文本数据的得分,根据得分将其划分到预设对应类别中。该方法使用BERT以及双向长短期记忆网络等构建基于Bert‑LSTM的文本多特征分类模型,利用挖掘文本多方面的词特征信息和词义潜在语义表示特征信息,融入文本向量,模型在训练过程中充分利用多特征信息,提升了文本分类的性能。

    一种时空联合的交通流量预测方法及装置

    公开(公告)号:CN114529081A

    公开(公告)日:2022-05-24

    申请号:CN202210150863.1

    申请日:2022-02-18

    Abstract: 本发明公开了一种时空联合的交通流量预测方法及装置,属于交通流量预测技术领域,其中,该方法包括:获取各个监测点的监测数据,将数据按照时间周期性规律进行分类并建立数据集,根据数据集构建监测站点无向图,同时将数据集划分训练集、测试集和验证集;基于监测站点无向图,构建时空联合的交通流量预测模型;利用训练集对时空联合的交通流量预测模型进行训练,得到最优时空联合的交通流量预测模型;将验证集输入到最优时空联合的交通流量预测模型中,计算未来交通流量预测值。该方法通过对时空注意力进行解耦,将数据进行更加细粒性的特征划分,充分考虑到每个监测点和每个时刻的特征,更高效的提取数据中的空间相关性和时间。

    一种基于用户多意图演进的序列推荐方法

    公开(公告)号:CN114491248A

    公开(公告)日:2022-05-13

    申请号:CN202210067403.2

    申请日:2022-01-20

    Abstract: 本发明提出了一种基于用户多意图演进的序列推荐方法,所述方法具体包括:采集用户的历史交互数据,并对数据进行预处理;设计多意图提取模块,捕获用户的多个意图;设计意图感知重映射层,将序列的顺序信息和时间信息显示地注入到用户项目的交互序列中;设计意图感知演进层,捕捉用户每个兴趣意图的动态偏移;设计多意图聚合模块,在更精细的意图粒度上捕获具有更多信息的用户表示。本发明可以同时考虑用户历史交互序列中的潜在多意图、不同意图的动态演变以及丰富候选物品的特征表示最大化的利用多意图嵌入的好处,从而达到提升推荐性能的目的。

    基于子载波动态选择的速度自适应室内人体检测方法

    公开(公告)号:CN109409216B

    公开(公告)日:2022-04-05

    申请号:CN201811086897.9

    申请日:2018-09-18

    Abstract: 本发明涉及一种基于子载波动态选择的速度自适应室内人体检测方法,训练阶段包括信道状态信息的获取及预处理;信道状态信息去噪;信道状态信息特征值提取;信道状态信息分类训练,检测阶段包括信道状态信息预处理;提取窗口内的特征值:按照窗口分割进行特征值提取,所述特征值作为人体检测的验证数据;人体检测。该方法可以防止由于慢速移动对信道状态信息影响不明显,而造成检测结果不准确的情况发生,有效的解决检测环境中存在慢速移动的人体时,检测漏报率较高的问题。

    一种基于半监督聚类的迁移学习方法

    公开(公告)号:CN103020122A

    公开(公告)日:2013-04-03

    申请号:CN201210464867.3

    申请日:2012-11-16

    Abstract: 本发明提供的是一种基于半监督聚类的迁移学习方法。包括计算目标数据与辅助数据各类中数据的相似度、平均相似度;由平均相似度得到目标数据与类标签的一个相似度权重向量,取向量中权重最大的为目标数据的标签;以目标数据为质心,进行K-均值聚类,聚类成簇,每簇中以簇中数据占所属类中总数据比例最大者的标签为簇标签;将再分类结果与预分类结果做对比;在最终形成的目标数据相似度权重向量中,挑选权重最大的数据标签作为目标数据数据标签,从而形成最终分类器。本发明提供一种将分类方法、技术从一个领域迁移到另一个领域的提高分类结果精确度的一种基于半监督聚类的迁移学习方法。

    基于Bert-LSTM的文本多特征分类方法及装置

    公开(公告)号:CN114547303B

    公开(公告)日:2024-10-29

    申请号:CN202210165299.0

    申请日:2022-02-18

    Abstract: 本发明公开了一种基于Bert‑LSTM的文本多特征分类方法及装置,属于文本分类技术领域,其中,该方法包括:确定待分类文本数据集,并划分为训练集和测试集;构建基于Bert‑LSTM的文本多特征分类模型;利用训练集对文本多特征分类模型进行训练,得到最优文本多特征分类模型;将待分类文本数据输入最优文本多特征分类模型中,计算待分类文本数据的得分,根据得分将其划分到预设对应类别中。该方法使用BERT以及双向长短期记忆网络等构建基于Bert‑LSTM的文本多特征分类模型,利用挖掘文本多方面的词特征信息和词义潜在语义表示特征信息,融入文本向量,模型在训练过程中充分利用多特征信息,提升了文本分类的性能。

Patent Agency Ranking