-
公开(公告)号:CN110737821B
公开(公告)日:2022-06-07
申请号:CN201810719378.5
申请日:2018-07-03
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/9535 , G06F40/289 , G06K9/62
Abstract: 本发明提出一种相似事件查询的方法、装置、存储介质和终端设备,其中,所述方法包括:根据待查询事件的主题类别,从事件库中获取与所述主题类别相匹配的事件,获得主题事件集合;其中,所述事件库包括多个事件,每个事件包括事件的主题类别、触发词和事件特征;根据所述待查询事件的触发词,判断所述主题事件集合是否包括与所述触发词相匹配的事件;以及当所述主题事件集合包括与所述触发词匹配的事件时,根据所述待查询事件的事件特征,从所述主题事件集合中获取与所述待查询事件相似的事件。采用本发明,可以减少计算事件相似度的计算量,提高获取相似事件的效率。
-
公开(公告)号:CN108182211B
公开(公告)日:2020-06-30
申请号:CN201711374282.1
申请日:2017-12-19
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/783 , G06F16/78 , G06Q50/00
Abstract: 本发明公开了视频舆情获取方法、装置、计算机设备及存储介质,其中方法包括:获取信息来源及监控实体;从信息来源获取实时流数据;针对实时流数据中的每个视频,分别对视频进行预定内容识别,得到识别结果;根据识别结果确定视频与监控实体是否相匹配,若匹配,则生成视频对应的舆情信息并存储。应用本发明所述方案,能够获取到视频类舆情信息。
-
公开(公告)号:CN110738046A
公开(公告)日:2020-01-31
申请号:CN201810720034.6
申请日:2018-07-03
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F40/289 , G06F40/30 , G06F40/216 , G06F16/35
Abstract: 本发明提出一种观点抽取方法及装置,其中方法包括:获取待处理的文本内容;将文本内容中的各个语句输入预设的主观句识别模型,获取各个语句中的主观句;主观句为对评论对象进行评论的语句;针对主观句,抽取主观句中的观点五元组;观点五元组包括:评论对象、评论属性、评论词、评论者以及评论时间;根据观点五元组,确定针对评论对象和评论属性的各类型评论的占比;将针对评论对象和评论属性的各类型评论的占比,以及主观句,确定为文本内容对应的观点,从而能够先提取文本内容中的主观句,然后针对主观句进行五元组抽取和观点分析操作,减少了需要分析的五元组的数量,提高了五元组分析的准确度,能够满足实时性和准确率的要求。
-
公开(公告)号:CN110737820A
公开(公告)日:2020-01-31
申请号:CN201810717197.9
申请日:2018-07-03
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/9535 , G06F16/9537 , G06F16/2458
Abstract: 本申请实施例公开了用于生成事件信息的方法和装置。该方法的一具体实施方式包括:获取第一搜索用信息集合,其中,第一搜索用信息是驻地位于目标地理区域内的用户的搜索用信息;对于第一搜索用信息集合中的第一搜索用信息,对该第一搜索用信息进行分析,获取与该第一搜索用信息对应的事件信息;合并获取到的事件信息得到事件信息集合。该事件信息集合中的事件信息所指示的事件可以被确定为目标地理区域内的居民所关注的事件。该实施方式可以实现对目标地理区域内的居民所关注的事件的挖掘。
-
公开(公告)号:CN110738056B
公开(公告)日:2023-12-19
申请号:CN201810717188.X
申请日:2018-07-03
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请实施例公开了用于生成信息的方法和装置。该方法的一具体实施方式包括:获取评论信息集合;对于评论信息集合中的评论信息,从该评论信息中提取出目标词,将提取出的目标词组成词组,其中,目标词包括评价对象词和评价词;对于所组成的至少一个词组中的词组,将该词组中的评价对象词和评价词输入预先训练的预测模型,得到预测结果,基于预测结果确定该词组中的评价对象词和评价词是否搭配,若搭配,则将该词组归入词组集合;基于词组集合中的词组生成观点信息。该实施方式实现了对具有较高可读性的观点信息的生成。(56)对比文件汝承森;饶岚;王挺.网络信息中评价搭配识别及倾向性判断.计算机科学.2013,(第07期),全文.李志义;王冕;赵鹏武.基于条件随机场模型的“评价特征-评价词”对抽取研究.情报学报.2017,(第04期),全文.
-
公开(公告)号:CN107977678B
公开(公告)日:2021-12-03
申请号:CN201711212965.7
申请日:2017-11-28
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/35 , G06F16/951 , H04L29/08
Abstract: 本申请公开了用于输出信息的方法和装置。该方法的一具体实施方式包括:从目标资讯网站获取资讯数据集合;确定资讯数据集合中的每条资讯数据所属的领域;对于每个领域,将资讯数据集合中属于该领域的资讯数据进行聚类分析,得到每个聚类簇中资讯数据的数量和聚类中心;对于每个领域的每个聚类簇,将该聚类簇中的聚类中心作为该领域的热点资讯,将属于该聚类簇中资讯数据的数量作为该热点资讯的资讯热度进行输出。该实施方式能够提高领域识别的准确度并提高识别热点资讯的速度。
-
公开(公告)号:CN111104790A
公开(公告)日:2020-05-05
申请号:CN201811179956.7
申请日:2018-10-10
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F40/211 , G06F40/295
Abstract: 本发明提出一种抽取关键关系的方法、装置、设备及计算机可读介质,所述抽取关键关系的方法包括:从文章中抽取实体关系组,所述实体关系组包括所述文章的至少两个实体以及所述至少两个实体之间的关系;从所述文章中抽取关键锚点;基于各实体关系组与所述关键锚点之间的相似度,选取实体关系组作为所述文章的关键关系。本发明的技术方案可以帮助用户了解文章中的重要实体关系。
-
公开(公告)号:CN110738056A
公开(公告)日:2020-01-31
申请号:CN201810717188.X
申请日:2018-07-03
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请实施例公开了用于生成信息的方法和装置。该方法的一具体实施方式包括:获取评论信息集合;对于评论信息集合中的评论信息,从该评论信息中提取出目标词,将提取出的目标词组成词组,其中,目标词包括评价对象词和评价词;对于所组成的至少一个词组中的词组,将该词组中的评价对象词和评价词输入预先训练的预测模型,得到预测结果,基于预测结果确定该词组中的评价对象词和评价词是否搭配,若搭配,则将该词组归入词组集合;基于词组集合中的词组生成观点信息。该实施方式实现了对具有较高可读性的观点信息的生成。
-
公开(公告)号:CN108197102A
公开(公告)日:2018-06-22
申请号:CN201711436235.5
申请日:2017-12-26
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/27
Abstract: 本发明提出一种文本数据统计方法、装置和服务器,所述方法包括:获取目标文本和第一待比对文本集合;其中,所述第一待比对文本集合包括多个待比对文本,每个待比对文本为用户在一次搜索中输入的搜索文本;根据短文本语义相似度算法,计算每个待比对文本与所述目标文本之间的文本相似度,并且将所述文本相似度大于第一阈值的待比对文本作为待分析对象;和基于用户的至少一个属性,对所述待分析对象对应的用户进行统计,生成并输出统计结果。本发明实施例中,能够实现针对对目标文本感兴趣的用户、即目标文本对应的事件所针对的受众的分析。
-
公开(公告)号:CN107977678A
公开(公告)日:2018-05-01
申请号:CN201711212965.7
申请日:2017-11-28
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了用于输出信息的方法和装置。该方法的一具体实施方式包括:从目标资讯网站获取资讯数据集合;确定资讯数据集合中的每条资讯数据所属的领域;对于每个领域,将资讯数据集合中属于该领域的资讯数据进行聚类分析,得到每个聚类簇中资讯数据的数量和聚类中心;对于每个领域的每个聚类簇,将该聚类簇中的聚类中心作为该领域的热点资讯,将属于该聚类簇中资讯数据的数量作为该热点资讯的资讯热度进行输出。该实施方式能够提高领域识别的准确度并提高识别热点资讯的速度。
-
-
-
-
-
-
-
-
-