文本核心词识别方法和装置

    公开(公告)号:CN108334489B

    公开(公告)日:2021-05-14

    申请号:CN201710044590.1

    申请日:2017-01-19

    Abstract: 本申请公开了一种文本核心词识别方法和装置,其中,该方法包括:根据一级样本文本、所述一级样本文本的一级优选核心词,以及所述一级优选核心词的实体特征,训练得到条件随机场CRF模型;从利用所述CRF模型和至少一种关键词提取算法分别针对二级样本文本所提取出的关键词中,选出所述二级样本文本的二级优选核心词;根据所述二级样本文本和所述二级优选核心词,对深度神经网络模型进行训练,得到文本核心词识别模型;以及利用所述文本核心词识别模型,识别目标文本的核心词。应用本申请,可通过多层次优化训练样本,提高文本核心词识别模型的识别准确率,以此提高抽取的核心词的准确度。

    用于确定污染区域的方法和装置

    公开(公告)号:CN111178653A

    公开(公告)日:2020-05-19

    申请号:CN201811347192.8

    申请日:2018-11-13

    Abstract: 本申请实施例公开了用于确定污染区域的方法和装置。该方法的一具体实施方式包括:将目标区域划分为至少一个子区域,对于至少一个子区域中的子区域,确定该子区域在预设时间段内的污染指数,其中,该子区域在预设时间段内的污染指数为该子区域所包括的兴趣点在预设时间段内的污染指数之和,兴趣点的污染指数基于兴趣点的关联信息确定,兴趣点的关联信息包括:兴趣点的污染关联参数、污染关联参数对应的污染影响权重;从至少一个子区域中选择出污染指数大于或等于预设数值的子区域作为污染区域。该实施方式可以更加精细的检测出污染严重的区域。

    文本核心词识别方法和装置

    公开(公告)号:CN108334489A

    公开(公告)日:2018-07-27

    申请号:CN201710044590.1

    申请日:2017-01-19

    Abstract: 本申请公开了一种文本核心词识别方法和装置,其中,该方法包括:根据一级样本文本、所述一级样本文本的一级优选核心词,以及所述一级优选核心词的实体特征,训练得到条件随机场CRF模型;从利用所述CRF模型和至少一种关键词提取算法分别针对二级样本文本所提取出的关键词中,选出所述二级样本文本的二级优选核心词;根据所述二级样本文本和所述二级优选核心词,对深度神经网络模型进行训练,得到文本核心词识别模型;以及利用所述文本核心词识别模型,识别目标文本的核心词。应用本申请,可通过多层次优化训练样本,提高文本核心词识别模型的识别准确率,以此提高抽取的核心词的准确度。

    用于扩展查询式的方法和装置

    公开(公告)号:CN107609152A

    公开(公告)日:2018-01-19

    申请号:CN201710867794.5

    申请日:2017-09-22

    Abstract: 本申请公开了用于扩展查询式的方法和装置。该方法的一具体实施方式包括:基于与目标查询式关联的图片点击日志计算目标查询式的图片点击特征向量;基于目标查询式的图片点击特征向量,在预设的查询式集合中查找目标查询式的相似查询式,得到目标查询式的候选扩展查询式集合;将目标查询式和各候选扩展查询式与知识图谱中的实体词和限定词匹配,以提取出目标查询式和各候选扩展查询式的实体词和限定词;结合知识图谱对目标查询式和各候选扩展查询式的实体词和限定词进行扩展;对目标查询式和各候选扩展查询式的实体词和限定词的扩展结果进行匹配,以从候选扩展查询式集合中确定出目标查询式的扩展查询式。该实施方式提升了扩展查询式的丰富性。

    网页内容的处理方法和装置

    公开(公告)号:CN106446072A

    公开(公告)日:2017-02-22

    申请号:CN201610807127.3

    申请日:2016-09-07

    Abstract: 本发明实施例公开了一种网页内容的处理方法和装置。所述方法包括:读取与待处理网页对应的HTML结构正文数据;以段落为单位,对所述HTML结构正文数据进行结构划分,生成段落列表;根据所述段落列表中各段落中具有标题属性的内容,将所述段落列表中的各段落转化为标题文本对。本发明实施例的技术方案在识别出网页正文各段落中包括的标题以及段落正文,并将其整理归纳到一起生成标题文本对后,可以实现使用识别出的标题文本对中的标题来进一步描述网页内容,扩充网页内容的描述信息的技术效果,极大的简化了网页的分析过程,优化了现有的网页内容的处理技术,满足了人们日益增长的个性化、便捷化的网页内容的处理需求。

    图像识别方法及装置
    7.
    发明公开

    公开(公告)号:CN111931799A

    公开(公告)日:2020-11-13

    申请号:CN201910395441.9

    申请日:2019-05-13

    Abstract: 本发明提出一种图像识别方法及装置,其中方法包括:通过获取待识别的图像;将所述待识别的图像输入多个预设的深度残差网络,得到多个识别结果;识别结果为图像中存在目标对象的概率;深度残差网络对应的训练数据中,正样本与负样本的数量一致;根据所述多个识别结果,确定所述待识别的图像中是否存在所述目标对象。由此,相比采用单个模型进行识别,通过多个预设的深度残差网络分别对待识别的图像进行识别,弥补单个模型因欠采样可能出现的识别错误问题,识别准确度更高。此外,深度残差网络是更深层次的神经网络,相比于诸如CNN、深层的卷积神经网络AlexNet等深层网络和非深度学习的方法,能够学习到更多与图片标签相关的特征,分类性能提升明显。

    用于识别文本蕴含关系的方法和装置

    公开(公告)号:CN111666405A

    公开(公告)日:2020-09-15

    申请号:CN201910168639.3

    申请日:2019-03-06

    Abstract: 本申请实施例公开了用于识别文本蕴含关系的方法和装置。该方法的一具体实施方式包括:获取前提句和假设句;确定前提句对应的前提句向量序列和假设句对应的假设句向量序列;将前提句向量序列与假设句向量序列输入至预先训练的句匹配模型,得到句匹配信息,并将前提句向量序列与假设句向量序列输入预先训练的词匹配模型,得到词匹配信息;基于句匹配信息、词匹配信息以及预先训练的分类模型生成前提句与假设句的文本蕴含关系。该实施方式提供了一种基于词匹配信息与句匹配信息的文本蕴含关系识别机制,丰富了文本蕴含关系的识别方法。

    空气质量指数AQI的预测方法和装置

    公开(公告)号:CN111222672A

    公开(公告)日:2020-06-02

    申请号:CN201811429242.7

    申请日:2018-11-27

    Abstract: 本发明提供一种空气质量指数AQI的预测方法和装置。该方法包括:获取M个网格的空气质量指数AQI;分别计算M个网格中每个网格和待预测网格之间的距离以及网格相似度;所述网格相似度包括M个网格中每个网格和所述待预测网格之间的兴趣点POI的相似度、交通拥堵度相似度和用户活跃度相似度;根据所述M个网格的AQI、所述距离、所述网格相似度和预先训练的空间预测模型,确定所述待预测网格的AQI。和现有技术中线性差值的方式相比,提高了预测得到的AQI的准确度。

Patent Agency Ranking