一种基于马尔可夫聚类的实体间关系消解方法

    公开(公告)号:CN105893481A

    公开(公告)日:2016-08-24

    申请号:CN201610187149.4

    申请日:2016-03-29

    Abstract: 本发明提供一种基于马尔可夫聚类的实体间关系消解方法,包括:计算K个实体中任意两个实体之间的语义相似度;根据实体间的语义相似度构造赋权图G;构造状态转移矩阵M;在状态转移矩阵M上执行马尔科夫聚类算法,得到多个关系簇;其中,每个簇代表一系列语义相近似的实体。本发明提供的基于马尔可夫聚类的实体间关系消解方法具有以下优点:提出了融合词法和语义的相似度计算方法,然后给出了基于马尔科夫图聚类的关系聚类方法。该方法与层次聚类方法相比,聚类纯度指标有了一定提高,还具有计算过程简单快速的优点。

    结合用户情感表达方式的中文情感新词识别方法和系统

    公开(公告)号:CN105786991A

    公开(公告)日:2016-07-20

    申请号:CN201610089962.8

    申请日:2016-02-18

    CPC classification number: G06F17/30731 G06F17/2715

    Abstract: 本发明公开了一种结合用户情感表达方式的中文情感新词识别方法和系统。其中,该方法包括获取输入文本;基于所述输入文本中词频大于第一预设阈值的字符串,构建候选新词集合;使用中文旧词词库对所述候选新词集合进行过滤;基于统计指标从过滤的候选新词集合中筛选新词,构建新词集合;其中,所述统计指标为构词能力、点互信息、灵活度和邻接熵;基于情感倾向点互信息,从所述新词集合中识别情感新词,构建初始情感新词集合;基于所述输入文本中涉及的用户的情感表达方式,从所述初始情感新词集合中筛选高置信度情感新词,并将其作为所识别的中文情感新词。通过本发明实施例解决了如何提高情感新词识别的精度和灵活度的技术问题。

    针对特定领域的新词发现方法

    公开(公告)号:CN105760366A

    公开(公告)日:2016-07-13

    申请号:CN201610150038.6

    申请日:2016-03-16

    CPC classification number: G06F17/2715 G06F17/277

    Abstract: 本发明提供一种针对特定领域的新词发现方法,包括以下步骤:步骤1,文档预处理;步骤2,构建候选新词集;其中,每个候选新词由词语、该词语距离所述中心词语的距离向量值以及所述中心词语均采用新词表述方式表达。步骤3,候选新词挖掘;优点为:针对特定领域的新词发现方法,采用更灵活的新词表达方式,将数据挖掘领域的关联规则方法引入新词发现过程,并创新地提出将词汇与指定关键词的距离向量作为关联规则挖掘的重要特征,由此可快速准确全面的识别出文档包含的所有新词。

    一种基于关键传播结构感知的意见领袖识别方法和装置

    公开(公告)号:CN114297498B

    公开(公告)日:2024-10-15

    申请号:CN202111638795.5

    申请日:2021-12-29

    Abstract: 本发明通过网络技术处理领域的方法,实现了一种基于关键传播结构感知的意见领袖识别方法和装置。方法基于神经网络算法,设计用户双重特征提取模块和关键传播结构挖掘模块两个逻辑模块组成,通过输入微博中不同话题数据,得到输入数据中具有代表性特征的意见领袖及关联关系输出。本发明设计基于节点中心度的消息传递机制,充分结合了节点在拓扑结构中的重要性,构造了一个新的图神经网络模型提取社交网络中用户的特征。首次利用图分类任务挖掘不同事件中的关键结构信息,在挖掘社交网络中top‑k个意见领袖的同时能够从节点连通性、节点相似度、节点中心度三个角度学习意见领袖之间潜在的联系,构造网络中的关键传播结构。

    神经机器翻译模型的训练方法、翻译方法及装置

    公开(公告)号:CN115345181A

    公开(公告)日:2022-11-15

    申请号:CN202210786892.7

    申请日:2022-07-04

    Abstract: 本发明提供一种神经机器翻译模型的训练方法、翻译方法及装置,所述训练方法包括:构建神经机器翻译模型;将双语平行句对中的源语言句子和目标语言句子,以及知识图谱中每个三元组中的头实体和尾实体进行细粒度切分,得到标准源语言句子序列、标准目标语言句子序列以及知识图谱中每个三元组中的标准头实体‑关系序列和标准尾实体序列;将其输入编解码模块中预测得到目标语言句子序列以及尾实体序列;基于标准目标语言句子序列和预测的目标语言句子序列之间的交叉熵,以及知识图谱中每个三元组中的标准尾实体序列与预测的尾实体序列之间的交叉熵,共同训练该模型。本发明能够有效融合细粒度知识推断,提升神经机器翻译对于实体的翻译质量。

    面向多社交网络平台的机器人检测方法

    公开(公告)号:CN114881161A

    公开(公告)日:2022-08-09

    申请号:CN202210546540.4

    申请日:2022-05-20

    Abstract: 本发明公开了一种面向多社交网络平台的机器人检测方法,包括:获取社交网络平台的用户账号数据,将账号ID作为用户的唯一标识符,提取用户特征,朋友特征,网络特征,内容特征,情感特征,时序特征;构建高维的原始矩阵,通过显著性分析,得到低维的特征矩阵;采用聚类算法或分类算法实现划分,识别出正常用户账号与机器人账号。本发明还公开了一种面向多社交网络平台的机器人检测装置、电子设备及存储介质。本发明对境内外多个社交网络平台账号数据进行研究,通过特征表示、特征显著性分析、聚类或分类等算法进行社交机器人检测,识别出社交网络中的社交机器人账号,从而预警大规模社交机器人异常行为,进而维护社交网络安全。

Patent Agency Ranking