基于无监督聚类的长文本可信度评估方法及系统

    公开(公告)号:CN110287314B

    公开(公告)日:2021-08-06

    申请号:CN201910418900.0

    申请日:2019-05-20

    Abstract: 本发明涉及一种基于无监督聚类的长文本可信度评估方法,包括:以已知长文本获取训练数据,提取该训练数据的训练特征以构建训练特征向量集,对该训练特征向量集进行无监督聚类,得到多个训练类心;以待评估长文本获取评估数据,提取该评估数据的评估特征向量;获取该评估特征向量相对该训练类心的评估值,并以该评估值得到该待评估长文本的可信度。本发明通过无监督聚类对长文本进行可信度评估,在实施过程中不需要标注数据,节省了人力、物力与时间,避免了数据中标签稀疏带来的困扰;提取了长文本的文本特征,对于可信度评估任务更加适用,使用该模型得到的文本的可信度更具有可解释性,同时在平台之间可以迁移。

    基于无监督聚类的长文本可信度评估方法及系统

    公开(公告)号:CN110287314A

    公开(公告)日:2019-09-27

    申请号:CN201910418900.0

    申请日:2019-05-20

    Abstract: 本发明涉及一种基于无监督聚类的长文本可信度评估方法,包括:以已知长文本获取训练数据,提取该训练数据的训练特征以构建训练特征向量集,对该训练特征向量集进行无监督聚类,得到多个训练类心;以待评估长文本获取评估数据,提取该评估数据的评估特征向量;获取该评估特征向量相对该训练类心的评估值,并以该评估值得到该待评估长文本的可信度。本发明通过无监督聚类对长文本进行可信度评估,在实施过程中不需要标注数据,节省了人力、物力与时间,避免了数据中标签稀疏带来的困扰;提取了长文本的文本特征,对于可信度评估任务更加适用,使用该模型得到的文本的可信度更具有可解释性,同时在平台之间可以迁移。

    图像增强方法、真伪商品鉴别方法及设备

    公开(公告)号:CN112699726B

    公开(公告)日:2023-04-07

    申请号:CN202011251301.3

    申请日:2020-11-11

    Abstract: 本发明涉及一种图像增强方法、真伪商品鉴别方法及设备。本发明的目的是提供一种图像增强方法、真伪商品鉴别方法及设备,以避免数据集有偏导致分类模型过拟合到无关因子。本发明的技术方案是:一种图像增强方法,其特征在于:S01、对于具体的图像分类任务分析其中分类无关的有偏因子,控制有偏因子对应的属性为唯一变量,摄取图像作为源域数据集;S02、通过GAN网络结构训练有偏因子对应属性迁移模型,学习一个生成器G,x’=G(x,a);S03、在目标数据集上,应用经训练的生成器G扩充样本,对于目标数据集上的每一个样本,通过遍历有偏因子对应属性所有的取值a,得到无偏的生成样本。本发明适用于计算机视觉领域。

    一种基于检索辅助的谣言检测方法及系统

    公开(公告)号:CN110188284B

    公开(公告)日:2022-01-28

    申请号:CN201910341053.2

    申请日:2019-04-25

    Abstract: 本发明提出一种基于检索辅助的谣言检测方法及系统,包括:获取待谣言检测的对象信息,并使用谣言检测算法对该对象信息进行判定,得到该对象信息的初步谣言检测结果;集合已标记谣言标签的谣言信息作为谣言库,抽取得到该对象信息的关键词,以该关键词检索该谣言库,得到该谣言库中与该对象信息相似的多条相似谣言,计算每一条该相似谣言与该对象信息之间的相似度,以为每一条该相似谣言赋予权重,并根据每一条该相似谣言的谣言标签和权重,加权求和得到该多条相似谣言的辅助谣言检测结果;根据该初步谣言检测结果和该辅助谣言检测结果,综合判定该对象信息的谣言标签。

    基于面部划分的人脸深度伪造检测方法及系统

    公开(公告)号:CN113537027A

    公开(公告)日:2021-10-22

    申请号:CN202110776853.4

    申请日:2021-07-09

    Abstract: 本发明提出一种基于面部划分的人脸深度伪造检测方法和系统,包括:对训练数据,提取全局人脸特征;根据获取全局人脸特征过程中产生的浅层卷积特征,将该浅层卷积特征根据预设的面部划分方式,划分为多个图像区域,分别将该图像区域输入至局部人脸特征提取模型,得到该人脸图像的多个局部特征;通过注意力模型提取该多个局部特征间的关系特征,并将该关系特征与该全局特征拼接后输入至二分类模型,得到该训练数据的检测结果,根据该结果和该标签构建损失函数,以训练该全局人脸特征提取模型、局部人脸特征提取模型、注意力模型和该二分类模型。

    一种用于社交网络的隐私控制自动设置方法及系统

    公开(公告)号:CN110059498B

    公开(公告)日:2021-07-23

    申请号:CN201910216242.7

    申请日:2019-03-21

    Abstract: 本发明提出一种用于社交网络的隐私控制自动设置方法及系统,包括:根据待隐私控制用户的个人档案中各用户属性的可见性,统计待隐私控制用户的用户个人公开度;获取由多种隐私属性组成的隐私属性集合,以及获取待隐私控制用户待发布的文本信息,将文本信息输入至多个分类器,每个分类器对应一种隐私属性,分类器输出文本信息属于对应隐私属性取值上的概率分布,归一化概率分布的熵,得到文本信息的适合公开度;根据待隐私控制用户的好友的个人档案和发布内容,得到待隐私控制用户的每一个好友的好友个人公开度;根据用户个人公开度、适合公开度和好友个人公开度,度量文本信息对于各好友的隐私敏感度,并根据隐私敏感度确定文本信息的公开范围。

    基于微博平台的有价值新闻线索自动发现方法

    公开(公告)号:CN112597380A

    公开(公告)日:2021-04-02

    申请号:CN202011494287.X

    申请日:2020-12-17

    Abstract: 本发明涉及一种基于微博平台的有价值新闻线索自动发现方法。本发明的目的是提供一种基于微博平台的有价值新闻线索自动发现方法。本发明的技术方案是:一种基于微博平台的有价值新闻线索自动发现方法,其特征在于:S01、获取种子模式;S02、检索获取包含所述种子模式的距检索时间比较近的微博,作为信号微博;S03、对所有信号微博进行聚类,每个类描述的是同一个事件,对事件提取摘要,作为候选线索;S04、利用候选线索检索微博,扩展事件,对扩展后的事件提取特征,利用训练好的打分模型根据提取的特征对事件进行打分,选取得分值高于一定阈值的事件,并提取其摘要作为有价值的新闻线索。本发明适用于信息挖掘技术领域。

Patent Agency Ranking