基于社交应用采集资源管理和检测使用的系统和方法

    公开(公告)号:CN118708795A

    公开(公告)日:2024-09-27

    申请号:CN202410729579.9

    申请日:2024-06-06

    Abstract: 本发明公开了基于社交应用采集资源管理和检测使用的系统,包括:采集资源调度装置,其用于存储、初始化和分配采集资源;数据采集调度装置,其用于采集资源的申请与使用;采集资源状态收集装置,其用于存储使用完成的采集资源状态,并对采集资源进行分类;异常采集资源处理装置,其用于对异常采集资源进行删除、刷新和验证操作,并将刷新和验证后的采集资源更新到采集资源调度装置中;采集资源检测装置,其用于对采集资源调度装置中的采集资源进行可用性检测,并将不可用资源更新到采集资源状态收集装置中;以及,基于社交应用采集资源管理和检测使用的方法。本发明具有能确保采集资源可以得到最大化的利用,保障数据采集长期有效的完成等优点。

    文本分类方法、装置、设备及存储介质

    公开(公告)号:CN118568257A

    公开(公告)日:2024-08-30

    申请号:CN202410583477.0

    申请日:2024-05-11

    Abstract: 本公开涉及一种文本分类方法、装置、设备及存储介质。利用微调好的语言表示模型,对待分类文本中的语句进行处理,得到待分类文本的单词向量表示;从待分类文本的单词向量表示中获取具有语义关联关系的单词向量表示对,构建待分类文本的待处理图结构;利用预先训练的图卷积网络,对待分类文本的待处理图结构进行处理,得到待分类文本的向量表示矩阵;对待分类文本的向量表示矩阵进行分类处理,得到待分类文本的目标类别。这样,联合应用微调好的语言表示模型的表示学习能力和预先训练的图卷积网络的传导学习能力,能够提高文本分类的泛化能力,同时,结合微调好的语言表示模型对语境和语义的分析能力,提高了文本分类的精度。

    热点话题提取方法、装置、电子设备及存储介质

    公开(公告)号:CN117556043A

    公开(公告)日:2024-02-13

    申请号:CN202311490975.2

    申请日:2023-11-09

    Abstract: 本公开涉及一种热点话题提取方法、装置、电子设备及存储介质。其中,热点话题提取方法包括:获取目标文本;获取目标文本对应的多个主题以及每个主题对应的词语概率分布向量;基于词语概率分布向量计算多个主题中各个主题之间的主题相似度,并计算每个主题对应的主题一致性;基于主题相似度和主题一致性,对多个主题进行合并处理,得到至少一个主题簇;计算至少一个主题簇中每个主题簇分别对应的主题流行度和主题新颖度,基于主题流行度和主题新颖度确定目标文本对应的热点话题,由此,能够在进行热点话题提取时考虑到文本中各个词语之间的语义和语法关联性,提高了提取的热点话题的准确性。

    不规则文本标签化方法
    27.
    发明公开

    公开(公告)号:CN116628209A

    公开(公告)日:2023-08-22

    申请号:CN202310721792.0

    申请日:2023-06-19

    Abstract: 本发明涉及文本处理技术领域,尤其涉及一种不规则文本的标签化方法,本发明在对不规则文本进行标签化时,首先对所述不规则文本进行判断,判断所述不规则文本为长文本还是短文本,当所述不规则文本为长文本时,采用深度学习模型对所述长文本进行标签化,当所述不规则文本为短文本时,采用基于样本的分类模型对所述短文本进行标签化;这样,可有效提高不规则文本的分类准确率。

    社交账号区域位置信息的识别方法和装置

    公开(公告)号:CN115357631A

    公开(公告)日:2022-11-18

    申请号:CN202210668005.6

    申请日:2022-06-14

    Abstract: 本发明公开了一种社交账号区域位置信息的识别方法,其包括:采集社交账号的基本信息,所述基本信息至少包括:所在区域、个人简介;提取所在区域字段的内容,根据所在区域字段的内容得出位置信息,若无法得出位置信息,则采集社交账号的言论信息,提取言论信息发表时的定位经纬度,根据定位经纬度的地得出位置信息,若无法得出位置信息,则提取个人简介字段的内容,基于预设的位置匹配词在个人简介字段的内容中得出位置信息,若无法得出位置信息,则采集社交账号发表的文本信息,基于预设的位置匹配词在文本信息中得出位置信息。本发明可以通过账号注册时提供的位置信息、个人简介、经纬度、文本信息这四个维度进行区域位置分析。

    舆情塑造过程分析方法、装置、电子设备以及存储介质

    公开(公告)号:CN114861029A

    公开(公告)日:2022-08-05

    申请号:CN202210411631.7

    申请日:2022-04-19

    Inventor: 王鹏 陈志鹏 解峥

    Abstract: 本发明实施例公开了舆情塑造过程分析方法、装置、电子设备以及存储介质。该方法包括:获取目标舆情事件的舆情数据以及目标舆情事件的舆情数据的发布方;根据舆情数据,确定舆情主题;根据舆情数据随时间的变化情况,将目标舆情事件划分为多个发展阶段;根据目标舆情事件在每个发展阶段的舆情数据,确定在相应发展阶段的核心议题;从在每个发展阶段的舆情数据的发布方中,识别在相应发展阶段的舆情塑造主体;根据在每个发展阶段的核心议题与舆情主题的匹配情况,对目标舆情事件在多个发展阶段的舆情塑造主体对于目标舆情事件的舆情塑造效果进行评估。基于该方法,可以实现对于舆情塑造过程的全面分析,并实现对于舆情塑造效果进行准确评估。

Patent Agency Ranking