一种网络评论产生式摘要方法

    公开(公告)号:CN105912644A

    公开(公告)日:2016-08-31

    申请号:CN201610217911.9

    申请日:2016-04-08

    CPC classification number: G06F16/345 G06F17/2775

    Abstract: 本发明公开了一种网络评论产生式摘要方法。首先,基于标点符号对评论进行短语分割、分词并标记每个词语的词性,进而基于评论对象参数字典和句法模板过滤掉与评论对象无关的短语;然后,计算短语情感极性强度值,根据评论对象参数的所有短语的情感极性强度值对评论对象参数的重要性进行排序,选取最重要的一部分参数进行摘要生成;最后,针对选取的每个参数,选取一个对该参数最重要的一个评论短语,把选取的所有短语置入到设计好的摘要模板中以生成评论摘要。本发明综合利用了情感分析、词性分析等技术提取有效的用户评论信息,并根据设计好的模板生成摘要,对提高摘要的可读性和准确性有很大帮助。

    微博深度分类方法及系统
    152.
    发明公开

    公开(公告)号:CN105843957A

    公开(公告)日:2016-08-10

    申请号:CN201610236172.8

    申请日:2016-04-15

    Abstract: 本发明实施例提供一种微博深度分类方法及系统,该方法包括:将分词处理后的第一微博训练样本数据分别与各第一筛选词库进行词汇匹配,确定所述第一微博训练样本数据在所述各第一筛选词库中出现的词汇频率;将所述第一微博训练样本数据在所述各第一筛选词库中出现的词汇频率进行归一化处理,并将归一化处理后的数据输入学习模型;根据所述学习模型的输出确定微博事件分类模型;根据所述微博事件分类模型对微博文本进行分类。本发明实施例提供的微博深度分类方法及系统,能够对微博文本进行深入的细化分类,提高微博文本的分类正确率。

    一种基于自动机的实体关系快速抽取方法

    公开(公告)号:CN105824801A

    公开(公告)日:2016-08-03

    申请号:CN201610150794.9

    申请日:2016-03-16

    CPC classification number: G06F17/2785 G06F16/288

    Abstract: 本发明提供一种基于自动机的实体关系快速抽取方法,包括以下步骤:步骤1,定制规则文件;步骤2,对规则文件中的各个规则进行文法检查,检测规则文件中的各个规则是否满足文法要求,如果满足,则执行步骤3;步骤3,对通过文法检查的所述规则文件中的各个规则进行语义解释;步骤4,将语义解释后的所述规则文件中的各个规则进行解析编译,完成规则向层叠有限状态自动机的转换,得到有限状态自动机;步骤5,使用所述有限状态自动机,对输入的文本数据进行实体属性以及实体关系的抽取,得到最终的实体属性以及实体关系。优点为:能够保证对开放域文本进行快速的实体关系与实体属性抽取。同时,对于特定领域的实体关系可以定制化的进行抽取。

    舆情态势数据智能识别及异常检测方法

    公开(公告)号:CN118780275A

    公开(公告)日:2024-10-15

    申请号:CN202410586391.3

    申请日:2024-05-13

    Abstract: 本发明涉及数据识别与检测领域,尤其涉及一种舆情态势数据智能识别及异常检测方法,包括以下步骤:S1:采用多策略数据抽取方法,处理不同格式的数据源;引入自适应语义映射机制,通过语义深度调节因子SDF动态调整每个词的语义向量vi,使动态语义融合网络捕获更加丰富和准确的语义信息;S2:时间序列异常态势预测器通过融合动态解码模型TSIM,结合时间‑语义交互机制,将文本的语义信息与时间信息进行深度融合,评估舆情态势,预测及判断舆情态势异常,本方法大幅提升数据处理的准确性和工作效率,有利于及时发现并响应舆情异常,准确预测及判断舆情异常态势。

    文本立场分析方法、装置、设备及存储介质

    公开(公告)号:CN117574892A

    公开(公告)日:2024-02-20

    申请号:CN202311492828.9

    申请日:2023-11-09

    Abstract: 本公开涉及一种文本立场分析方法、装置、设备及存储介质,该方法包括:获取待分析文本和所述待分析文本对应的主题短语;对所述待分析文本与所述主题短语进行特征提取,得到文本向量和主题向量;将所述文本向量和所述主题向量输入预训练的分层胶囊模型,得到所述分层胶囊模型输出的根据所述主题短语对所述待分析文本进行立场分析的分析结果,所述分层胶囊模型包括词胶囊层、句子胶囊层和类别胶囊层,所述词胶囊层、句子胶囊层和类别胶囊层分别用于提取所述待分析文本的词级特征、句子级特征和类别特征。本公开通过设置分层胶囊模型,能够提取文本的不同层级的特征信息,从而挖掘文本的深层信息,提升对文本进行立场判断的准确度。

    一种基于时空推理的用户未来位置预测方法

    公开(公告)号:CN115905732A

    公开(公告)日:2023-04-04

    申请号:CN202211248018.4

    申请日:2022-10-12

    Abstract: 本发明涉及一种基于时空推理的用户未来位置预测方法,属于时空大数据分析与挖掘技术领域。针对目前用户未来位置预测工作中,因忽略人本身的行为规律信息导致的不足,为解决如何将人类行为规律融入未来位置预测的技术问题,在预测用户未来位置时,本方法充分考虑了时空数据的社会属性,对每一个位置将其类别也进行编码从而是模型可以获得位置的社会属性从而更好地挖掘位置信息。本方法充分考虑了人类自身的社会规律。将用户在星期、月份上的规律性也考虑进内,大幅提升了规律挖掘的深度。

    基于分布式数据采集任务调度方法及装置

    公开(公告)号:CN111857983B

    公开(公告)日:2023-02-28

    申请号:CN202010355882.9

    申请日:2020-04-29

    Inventor: 刘春阳 张旭 王鹏

    Abstract: 本发明公开了一种基于分布式数据采集任务调度方法,其包括:获取待处理任务;对待处理任务分类得到多个周期性重复任务;记录每个周期性重复任务在前n次执行中每次执行的起止时间点;计算每个周期性重复任务在前n次执行中的平均间隔时长每个周期性重复任务下一次执行的起始时间点,确定多个周期性重复任务的下一次执行顺序;记录每个任务执行器的负载;向多个任务执行器分别发送任务请求信号,并接受各个任务执行器的反馈信号;向接受到的第一个反馈信号对应的任务执行器发送需要最先执行的周期性重复任务。本发明还公开了一种基于分布式数据采集任务调度装置。本发明能够使得分布式系统执行任务时取得最优效果,运行更加稳健。

    语言命名实体识别方法、语言识别装置、电子设备及介质

    公开(公告)号:CN115358233A

    公开(公告)日:2022-11-18

    申请号:CN202210798992.1

    申请日:2022-07-06

    Abstract: 本发明提供一种语言命名实体识别方法、语言识别装置、电子设备及介质,该方法包括:获取目标语言对应的待标注数据集;根据所述待标注数据集,基于语言预测模型,得到目标预测数据;根据预设的已标注数据集及所述目标预测数据,得到目标数据集;根据所述目标数据集,基于语言识别模型,得到所述目标语言对应的实体识别结果。该方法用以解决现有技术中由于一些目标语言及这些目标语言对应的样本数据集具有一定的局限性,易导致电子设备无法对上述这些目标语言进行准确识别的缺陷,实现电子设备可对这些目标语言进行准确识别,得到准确性较高的实体识别结果。

Patent Agency Ranking