面向大规模分类体系的短文本标签方法、系统、装置

    公开(公告)号:CN110059181A

    公开(公告)日:2019-07-26

    申请号:CN201910202727.0

    申请日:2019-03-18

    Abstract: 本发明属于文本分类领域,具体涉及一种面向大规模分类体系的短文本标签方法、系统、装置,旨在为了解决有限数据情况下面向大规模分类体系的短文本标签系统的稳定性不高的问题。本发明方法包括:获取待分类的第一短文本信息集合,并基于正向最大匹配分词和word2vec词向量表示技术进行预处理得到第二短文本信息集合;基于规则的分类方法、有监督的神经网络分类方法,对第二短文本信息集合进行二分类后进行短文本过滤,并基于同样的分类方法进行各短文本的第一、二级分类标签,基于半监督学习的标签传播方法进行各短文本的第三、四级分类标签。本发明在有限数据情况下保证了面向大规模分类体系的短文本标签系统的稳定性。

    结合用户情感表达方式的中文情感新词识别方法和系统

    公开(公告)号:CN105786991B

    公开(公告)日:2019-03-15

    申请号:CN201610089962.8

    申请日:2016-02-18

    Abstract: 本发明公开了一种结合用户情感表达方式的中文情感新词识别方法和系统。其中,该方法包括获取输入文本;基于所述输入文本中词频大于第一预设阈值的字符串,构建候选新词集合;使用中文旧词词库对所述候选新词集合进行过滤;基于统计指标从过滤的候选新词集合中筛选新词,构建新词集合;其中,所述统计指标为构词能力、点互信息、灵活度和邻接熵;基于情感倾向点互信息,从所述新词集合中识别情感新词,构建初始情感新词集合;基于所述输入文本中涉及的用户的情感表达方式,从所述初始情感新词集合中筛选高置信度情感新词,并将其作为所识别的中文情感新词。通过本发明实施例解决了如何提高情感新词识别的精度和灵活度的技术问题。

    结合写作特征和序列特征的中文情感新词识别方法和系统

    公开(公告)号:CN105740236A

    公开(公告)日:2016-07-06

    申请号:CN201610066957.5

    申请日:2016-01-29

    CPC classification number: G06F17/2715 G06F17/2775

    Abstract: 本发明公开了一种结合写作特征和序列特征的中文情感新词识别方法和系统。该方法对于输入文本子句,基于情感词的作者写作特征和情感词的序列特征将文本子句表示为各种特征(如:字、词性等)的序列。然后,针对特征表示的文本子句,利用线性链条件随机场模型输出与文本子句对应的情感词标签序列。其中,线性链条件随机场模型基于包含传统情感词的文本训练得到。接着,基于文本子句中字的序列和情感词标签序列,利用有限状态自动机识别文本子句中的情感词,形成情感词集合。最后,利用中文旧词词库对情感词集合进行过滤,将未出现在中文旧词词库中的情感词作为中文情感新词。通过本发明实施例解决了如何提高情感新词识别精度和召回率的技术问题。

    一种基于频域信息与多任务学习的深度伪造视频鉴别方法

    公开(公告)号:CN115187891A

    公开(公告)日:2022-10-14

    申请号:CN202210585640.8

    申请日:2022-05-27

    Abstract: 本发明涉及一种基于频域信息与多任务学习的深度伪造视频鉴别方法,使用频域分析中的离散余弦变换,结合分块处理的方式保留部分RGB三通道图像的空间信息,得到频域特征作为输入数据;使用多任务学习的深度神经网络提取输入数据的特征,将Xception网络作为骨干网络模块,并设计基于反卷积运算的分割模块与基于特征融合的分类模块,将骨干网络模块与分割模块提取的特征融合;同时设计优化训练引导目标算法,将融合后的特征间关系转化为三维条件下的几何距离,通过优化训练引导目标算法完成多任务学习的深度神经网络模型的训练,得到深度伪造视频鉴别模型,完成深度伪造视频的鉴别。

    基于特征工程和表示学习的机器行为识别方法

    公开(公告)号:CN113608946A

    公开(公告)日:2021-11-05

    申请号:CN202110910834.6

    申请日:2021-08-10

    Abstract: 基于特征工程和表示学习的机器行为识别方法,由三个步骤构成:步骤一,对大数据进行分析,通过时间、频次等多维度的信息,建立3σ模型,用于确定机器行为的访问时间频段,在机器行为的访问时间频段下,通过分组聚合等方式,归纳总结提取出基于机器行为的特征;步骤二,并通过查阅API文档、软件模拟复现、官方的RFC文档等方式对行为进行定义和命名,整合成一组完备的机器行为特征,完成基于特征工程机器行为识别工作;步骤三,对识别效果不佳的模型加入与其他行为存在交集的特征,去排除其他行为,以提高准确率。

Patent Agency Ranking