文本分类方法、模型训练方法、相关装置及电子设备

    公开(公告)号:CN115658903A

    公开(公告)日:2023-01-31

    申请号:CN202211357036.6

    申请日:2022-11-01

    Abstract: 本公开提供了一种文本分类方法、模型训练方法、相关装置及电子设备,涉及人工智能技术领域,具体涉及智能搜索、深度学习技术领域。具体实现方案为:获取目标场景下的第一文本,以及获取所述目标场景下的第一数据集,所述第一数据集包括M个类别下的K个第二文本,每个类别下对应至少一个所述第二文本;对所述第一文本进行特征编码,得到第一特征;以及分别对所述K个第二文本进行特征编码,得到K个第二特征;分别确定所述第一特征和所述K个第二特征之间的相似度,得到所述M个类别对应的M个第一相似度;基于所述M个第一相似度,确定所述第一文本在所述目标场景下所属的目标类别。

    污染企业的挖掘方法、装置及设备

    公开(公告)号:CN111209392A

    公开(公告)日:2020-05-29

    申请号:CN201811386695.6

    申请日:2018-11-20

    Abstract: 本发明实施例提供一种污染企业的挖掘方法、装置及设备,根据待识别的舆情数据,获取至少一个候选句子,各所述候选句子为包含污染信息的句子,对各所述候选句子进行分词处理,得到各所述候选句子对应的词序列,将各所述词序列输入至企业识别模型中,获取各所述词序列对应的标签序列,根据各所述词序列对应的标签序列,确定污染企业的名称;通过利用企业识别模型对待识别的舆情数据进行识别,提高了污染企业的挖掘准确率;另外,还解决了现有技术中制定的规则模板扩展性弱的问题,并且规避了制定规则模板所需要耗费的人力和时间成本,提高了污染企业挖掘的效率。

    模型训练、线索排序方法、装置及设备

    公开(公告)号:CN111062736A

    公开(公告)日:2020-04-24

    申请号:CN201811210047.5

    申请日:2018-10-17

    Abstract: 本申请提供了一种模型训练方法,包括:获取目标用户的数据;将在获取数据之前的目标时长内,执行目标行为的目标用户作为正样本,未执行目标行为的目标用户作为负样本;提取正样本的特征和负样本的特征;根据正样本的特征和负样本的特征,对用于预测待预测用户在获取数据之后执行目标行为的概率的模型进行训练。本申请还提供了一种模型训练装置、设备及计算机可读存储介质,以及线索排序的方法、装置、设备及计算机可读存储介质。本申请实施例提供的模型训练方法和线索排序方法能够有助于优先开发成单意愿较高的线索,有效地提高了线索开发的效率。

    图像识别方法及装置
    4.
    发明授权

    公开(公告)号:CN111931799B

    公开(公告)日:2023-06-20

    申请号:CN201910395441.9

    申请日:2019-05-13

    Abstract: 本发明提出一种图像识别方法及装置,其中方法包括:通过获取待识别的图像;将所述待识别的图像输入多个预设的深度残差网络,得到多个识别结果;识别结果为图像中存在目标对象的概率;深度残差网络对应的训练数据中,正样本与负样本的数量一致;根据所述多个识别结果,确定所述待识别的图像中是否存在所述目标对象。由此,相比采用单个模型进行识别,通过多个预设的深度残差网络分别对待识别的图像进行识别,弥补单个模型因欠采样可能出现的识别错误问题,识别准确度更高。此外,深度残差网络是更深层次的神经网络,相比于诸如CNN、深层的卷积神经网络AlexNet等深层网络和非深度学习的方法,能够学习到更多与图片标签相关的特征,分类性能提升明显。

    用于确定污染区域的方法和装置

    公开(公告)号:CN111178653B

    公开(公告)日:2022-12-02

    申请号:CN201811347192.8

    申请日:2018-11-13

    Abstract: 本申请实施例公开了用于确定污染区域的方法和装置。该方法的一具体实施方式包括:将目标区域划分为至少一个子区域,对于至少一个子区域中的子区域,确定该子区域在预设时间段内的污染指数,其中,该子区域在预设时间段内的污染指数为该子区域所包括的兴趣点在预设时间段内的污染指数之和,兴趣点的污染指数基于兴趣点的关联信息确定,兴趣点的关联信息包括:兴趣点的污染关联参数、污染关联参数对应的污染影响权重;从至少一个子区域中选择出污染指数大于或等于预设数值的子区域作为污染区域。该实施方式可以更加精细的检测出污染严重的区域。

    用于确定污染区域的方法和装置

    公开(公告)号:CN111178653A

    公开(公告)日:2020-05-19

    申请号:CN201811347192.8

    申请日:2018-11-13

    Abstract: 本申请实施例公开了用于确定污染区域的方法和装置。该方法的一具体实施方式包括:将目标区域划分为至少一个子区域,对于至少一个子区域中的子区域,确定该子区域在预设时间段内的污染指数,其中,该子区域在预设时间段内的污染指数为该子区域所包括的兴趣点在预设时间段内的污染指数之和,兴趣点的污染指数基于兴趣点的关联信息确定,兴趣点的关联信息包括:兴趣点的污染关联参数、污染关联参数对应的污染影响权重;从至少一个子区域中选择出污染指数大于或等于预设数值的子区域作为污染区域。该实施方式可以更加精细的检测出污染严重的区域。

    事件脉络生成方法和装置

    公开(公告)号:CN106844466A

    公开(公告)日:2017-06-13

    申请号:CN201611193377.9

    申请日:2016-12-21

    CPC classification number: G06F17/30705

    Abstract: 本发明公开了事件脉络生成方法和装置,其中方法包括:针对待处理的事件,分别获取各时间窗口内的资源;针对每个时间窗口,分别确定出该时间窗口内的各资源的重要性评分,并从所述时间窗口内的各资源中选出重要性评分符合预定要求的资源,将选出的资源作为所述时间窗口内的代表性资源;将各时间窗口内的代表性资源按照时间顺序进行组合,得到事件脉络。应用本发明所述方案,能够提高用户的信息获取效率。

    识别社交短文本类别的方法、分类模型训练方法及装置

    公开(公告)号:CN104951542A

    公开(公告)日:2015-09-30

    申请号:CN201510346581.9

    申请日:2015-06-19

    CPC classification number: G06F16/35

    Abstract: 本发明实施例提供了一种识别社交短文本类别的方法、分类模型训练方法及装置。其中,用于识别社交短文本的类别的方法包括:获取社交短文本数据;从所述社交短文本数据提取文本特征数据;以所述文本特征数据作为输入,从经训练的至少两个短文本分类模型分别获取所述社交短文本数据的第一类别信息;根据获取的所述社交短文本数据的第一类别信息确定所述社交短文本数据的第二类别信息。本发明实施例的识别社交短文本类别的方法、分类模型训练方法及装置,能够自动、准确地识别社交短文本的类别信息,从而提高了对海量社交短文本的分类效果及准确率,广泛应用于各种短文本分析场景,且提升用户网络体验。

    文本分类方法、模型训练方法、相关装置及电子设备

    公开(公告)号:CN115658903B

    公开(公告)日:2023-09-05

    申请号:CN202211357036.6

    申请日:2022-11-01

    Abstract: 本公开提供了一种文本分类方法、模型训练方法、相关装置及电子设备,涉及人工智能技术领域,具体涉及智能搜索、深度学习技术领域。具体实现方案为:获取目标场景下的第一文本,以及获取所述目标场景下的第一数据集,所述第一数据集包括M个类别下的K个第二文本,每个类别下对应至少一个所述第二文本;对所述第一文本进行特征编码,得到第一特征;以及分别对所述K个第二文本进行特征编码,得到K个第二特征;分别确定所述第一特征和所述K个第二特征之间的相似度,得到所述M个类别对应的M个第一相似度;基于所述M个第一相似度,确定所述第一文本在所述目标场景下所属的目标类别。

Patent Agency Ranking