一种面向热点话题的渐进式观点抽取方法和系统

    公开(公告)号:CN113849628A

    公开(公告)日:2021-12-28

    申请号:CN202111075709.4

    申请日:2021-09-14

    Abstract: 本发明公开了一种面向热点话题的渐进式观点抽取方法和系统。该方法为:提供先验知识;基于先验知识构建种子事件结构图,图中包含观点信息结点以及代表观点元素间关系的边;结合当前阶段的事件结构图和数据进行观点抽取模型的训练和预测,训练结束后给出当前阶段数据的预测结果;去掉已经存在于事件结构图中的观点,将新观点提交给专家进行确认;将专家返回的确认结果进行筛选,去掉不合格的观点,将合格观点添加到事件结构图中;再次返回至观点抽取步骤,如此循环进行直至观点抽取模型达到收敛。本发明将历史信息用于同一话题下新文本观点抽取,能有效减缓不均衡热点话题数据集带给神经模型的影响,在少量标注数据下就能获得高质量的观点信息。

    社交平台用户属性预测方法、系统、移动设备及存储介质

    公开(公告)号:CN115952438B

    公开(公告)日:2023-11-17

    申请号:CN202211596521.9

    申请日:2022-12-12

    Abstract: 本发明提供一种社交平台用户属性预测方法、系统、移动设备及存储介质,社交平台用户属性预测方法包括以下步骤:采集社交平台用户的数据;对于采集到的数据进行文本特征的提取;将提取的文本特征输入到特征训练MLP,从而对于社交平台用户生成伪标签矩阵;计算不完全程度;根据生成的伪标签矩阵和计算出的不完全程度计算块相似矩阵;根据计算出的块相似矩阵计算社交平台用户之间特征传递的权重;根据计算出的权重基于异构图网络模型进行节点特征的聚合;使用经过异构图网络模型的节点特征的聚合之后的特征向量训练MLP对社交平台用户的属性进行分类预测。根据本发明,适用于不同在线社交平台,预测的准确率高。

    面向开放环境的弱监督持续文本分类方法、装置

    公开(公告)号:CN116401363A

    公开(公告)日:2023-07-07

    申请号:CN202310202945.0

    申请日:2023-03-06

    Abstract: 本发明涉及面向开放环境的弱监督持续文本分类方法、装置。方法包括:数据采集步骤;初步分类步骤;延迟分类决策步骤;种子词更新步骤。提出了一个弱监督文本分类的持续学习框架,通过延迟低置信度的分类决策,在分类准确性和决策及时性之间做出良好的权衡;并且实现了自动捕捉主题的语义变化,从而主动更新每个已知类别的种子词,做到了旧知识的维护和新知识的发现之间的平衡。

    社交平台用户属性预测方法、系统、移动设备及存储介质

    公开(公告)号:CN115952438A

    公开(公告)日:2023-04-11

    申请号:CN202211596521.9

    申请日:2022-12-12

    Abstract: 本发明提供一种社交平台用户属性预测方法、系统、移动设备及存储介质,社交平台用户属性预测方法包括以下步骤:采集社交平台用户的数据;对于采集到的数据进行文本特征的提取;将提取的文本特征输入到特征训练MLP,从而对于社交平台用户生成伪标签矩阵;计算不完全程度;根据生成的伪标签矩阵和计算出的不完全程度计算块相似矩阵;根据计算出的块相似矩阵计算社交平台用户之间特征传递的权重;根据计算出的权重基于异构图网络模型进行节点特征的聚合;使用经过异构图网络模型的节点特征的聚合之后的特征向量训练MLP对社交平台用户的属性进行分类预测。根据本发明,适用于不同在线社交平台,预测的准确率高。

Patent Agency Ranking