一种微博转发树和转发森林构建方法

    公开(公告)号:CN104778210A

    公开(公告)日:2015-07-15

    申请号:CN201510111754.9

    申请日:2015-03-13

    Abstract: 本发明公开了一种微博转发树和转发森林构建方法,属于数据挖掘领域,包括以下步骤:收集该条微博的原创微博信息;并且根据单条原创微博信息,获取其转发微博信息;然后在单条原创微博信息及其所有转发微博信息上,构造单条微博的微博树结构;根据用户给定时间段t3-t4内的话题关键词Topic,收集与该话题相关的全量微博信息,针对每一条微博信息,构造单条微博的微博树结构;最后汇总该话题相关的全量微博信息的转发树;形成微博转发森林。本发明的优点为:通过转发树生成算法,高效快速完整地进行转发树和转发森林的提取,具有较高的效率和效果。

    一种基于时空推理的用户未来位置预测方法

    公开(公告)号:CN115905732A

    公开(公告)日:2023-04-04

    申请号:CN202211248018.4

    申请日:2022-10-12

    Abstract: 本发明涉及一种基于时空推理的用户未来位置预测方法,属于时空大数据分析与挖掘技术领域。针对目前用户未来位置预测工作中,因忽略人本身的行为规律信息导致的不足,为解决如何将人类行为规律融入未来位置预测的技术问题,在预测用户未来位置时,本方法充分考虑了时空数据的社会属性,对每一个位置将其类别也进行编码从而是模型可以获得位置的社会属性从而更好地挖掘位置信息。本方法充分考虑了人类自身的社会规律。将用户在星期、月份上的规律性也考虑进内,大幅提升了规律挖掘的深度。

    基于分布式数据采集任务调度方法及装置

    公开(公告)号:CN111857983B

    公开(公告)日:2023-02-28

    申请号:CN202010355882.9

    申请日:2020-04-29

    Inventor: 刘春阳 张旭 王鹏

    Abstract: 本发明公开了一种基于分布式数据采集任务调度方法,其包括:获取待处理任务;对待处理任务分类得到多个周期性重复任务;记录每个周期性重复任务在前n次执行中每次执行的起止时间点;计算每个周期性重复任务在前n次执行中的平均间隔时长每个周期性重复任务下一次执行的起始时间点,确定多个周期性重复任务的下一次执行顺序;记录每个任务执行器的负载;向多个任务执行器分别发送任务请求信号,并接受各个任务执行器的反馈信号;向接受到的第一个反馈信号对应的任务执行器发送需要最先执行的周期性重复任务。本发明还公开了一种基于分布式数据采集任务调度装置。本发明能够使得分布式系统执行任务时取得最优效果,运行更加稳健。

    语言命名实体识别方法、语言识别装置、电子设备及介质

    公开(公告)号:CN115358233A

    公开(公告)日:2022-11-18

    申请号:CN202210798992.1

    申请日:2022-07-06

    Abstract: 本发明提供一种语言命名实体识别方法、语言识别装置、电子设备及介质,该方法包括:获取目标语言对应的待标注数据集;根据所述待标注数据集,基于语言预测模型,得到目标预测数据;根据预设的已标注数据集及所述目标预测数据,得到目标数据集;根据所述目标数据集,基于语言识别模型,得到所述目标语言对应的实体识别结果。该方法用以解决现有技术中由于一些目标语言及这些目标语言对应的样本数据集具有一定的局限性,易导致电子设备无法对上述这些目标语言进行准确识别的缺陷,实现电子设备可对这些目标语言进行准确识别,得到准确性较高的实体识别结果。

    一种基于异构图注意力神经网络的暗网线索检测方法

    公开(公告)号:CN111737551B

    公开(公告)日:2022-08-05

    申请号:CN202010452949.0

    申请日:2020-05-26

    Abstract: 本发明公开一种基于异构图注意力神经网络的暗网线索检测方法:步骤一、对暗网进行文本采集;步骤二、针对采集到的暗网文本信息,进行事件标题、关键词及实体提取,构建动态异构信息网络;步骤三、对构建的异构信息网络中的节点进行embedding处理,并得到各节点的特征向量;步骤四、对异构信息网络的图结构进行学习;步骤五、根据对异构信息网络的图结构学习得到的结果,对异构信息网络中的节点进行线索类别分类,从而完成对暗网信息的线索检测。本发明利用了外部知识库作为依托,并且采用了两套方法来对构建的异构信息网络的图结构进行学习,具有良好的线索检测效果。

    一种多视角社交媒体用户立场检测方法与装置

    公开(公告)号:CN114357290A

    公开(公告)日:2022-04-15

    申请号:CN202111635132.8

    申请日:2021-12-29

    Abstract: 本发明通过网络技术处理领域的方法,公开了一种多视角社交媒体用户立场检测方法与装置,分为两个模块执行:多视角话题表征模块:根据原始语料构建包含多种节点的异构图,并从三个视角抽取出三种不同的以话题为中心的关系网络,构建用户表征,话题表征,文本表征;多视角用户立场检测模块:根据输入话题检索多视角话题表征模块输出的话题表征,取出该话题对应的话题表征,得到融合话题的文本表征并分别与多视角话题表征模块输出的用户表征,话题表征,文本表征进行拼接预测用户这段评论文本对该话题的立场,并利用与多视角话题表征模块共享的权重进行加权求和得到最终立场。实现了准确分析用户对某话题所持立场的效果。

    基于即时通讯工具的社群关系分析方法及装置

    公开(公告)号:CN114117348A

    公开(公告)日:2022-03-01

    申请号:CN202111412510.6

    申请日:2021-11-25

    Abstract: 本发明公开了一种基于即时通讯工具的社群关系分析方法,包括:根据即时通讯工具获取用户发送的社群信息的基本数据,所述基本数据包括与该用户发生社群关系的人员以及相对应的社群关系属性信息,基于所述社群关系属性信息计算用户与发生社群关系的人员的关系值,将关系值高的人员定义为密切人员;根据所述基本数据采用中心度算法计算用户的中心值,将中心值高的用户定义为中心点用户,并将各中心点用户对应的密切人员及相应的关系值以可视化的方式展示。本发明还公开了一种基于即时通讯工具的社群关系分析装置。本发明能够多维度、全方面分析每个人在社交圈中的社交关系和该人员在社交圈中的重要程度。

    一种基于热点事件的舆情知识图谱构建方法

    公开(公告)号:CN107633044B

    公开(公告)日:2021-08-06

    申请号:CN201710827984.4

    申请日:2017-09-14

    Abstract: 本发明公开了一种基于热点事件的舆情知识图谱构建方法,属于自然语言处理领域;首先实时获取微博文本,对每个微博文本进行处理,构建文本簇,计算每个文本簇所属的话题类别,按类别识别每个簇中的热点事件,统计每个热点事件的多维属性;识别参与热点事件讨论的重要人物和机构,并获取重要人物和机构的多维属性;最后构建事件、人物、机构的多维属性体系及关系类型,以事件、人物、机构为实体,事件、人物、机构之间的关系为关联,构建舆情知识图谱。本发明能够从多个维度对热点事件、人物、机构进行刻画,实现对热点事件、人物、机构的全方位解析;并根据实际需求,设置不同话题类别的权重,实现不同话题的舆情知识图谱构建。

Patent Agency Ranking