-
公开(公告)号:CN104598515A
公开(公告)日:2015-05-06
申请号:CN201410727133.9
申请日:2014-12-03
Applicant: 百度在线网络技术(北京)有限公司
CPC classification number: G06F16/635 , G06F16/683
Abstract: 本发明提出一种歌曲搜索方法、装置和系统,该歌曲搜索方法包括:接收要搜索的歌曲的信息,所述要搜索的歌曲的信息包括:要搜索的歌曲的简谱序列,或者,要搜索的歌曲的哼唱信息;根据所述要搜索的歌曲的信息,获取歌曲搜索结果,其中,所述歌曲搜索结果是根据所述要搜索的歌曲的信息确定所述要搜索的歌曲的简谱序列,并与预先保存的简谱序列进行比对后确定的;展示所述歌曲搜索结果。该方法能够提高歌曲搜索效果。
-
公开(公告)号:CN105468688B
公开(公告)日:2020-04-28
申请号:CN201510789321.9
申请日:2015-11-17
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/958
Abstract: 本发明实施例提供了一种站点模板的处理方法及装置。一方面,本发明实施例通过获取站点所提供的页面,以作为训练样本;从而,获取模板样式,所述模板样式中定义有至少一个字段;根据与各字段相匹配的字符串,在所述训练样本中进行匹配,以获得所述模板样式中定义的各字段的描述信息;进而,根据所述模板样式和所述模板样式中定义的各字段的描述信息,生成所述站点的站点模板。因此,本发明实施例提供的技术方案能够实现自动生成站点模板,提高了站点模板的生成效率,降低了站点模板的生成成本。
-
公开(公告)号:CN104484379B
公开(公告)日:2018-06-12
申请号:CN201410749432.2
申请日:2014-12-09
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明实施例提供一种确定音乐实体关系的方法和装置,该方法包括:从网络侧获取原始网页;从原始网页中提取第一网页,第一网页为包含有音乐关系关键词的网页;判断第一网页中是否存在样本句,样本句为包含有至少两个音乐实体的信息的句子;通过对样本句进行语义分析,确定所述至少两个音乐实体之间的关系,实现了音乐实体之间的关系的确定。
-
公开(公告)号:CN104484379A
公开(公告)日:2015-04-01
申请号:CN201410749432.2
申请日:2014-12-09
Applicant: 百度在线网络技术(北京)有限公司
CPC classification number: G06F17/30038 , G06F17/2785 , G06F17/30864
Abstract: 本发明实施例提供一种确定音乐实体关系的方法和装置,该方法包括:从网络侧获取原始网页;从原始网页中提取第一网页,第一网页为包含有音乐关系关键词的网页;判断第一网页中是否存在样本句,样本句为包含有至少两个音乐实体的信息的句子;通过对样本句进行语义分析,确定所述至少两个音乐实体之间的关系,实现了音乐实体之间的关系的确定。
-
公开(公告)号:CN103942224A
公开(公告)日:2014-07-23
申请号:CN201310024439.3
申请日:2013-01-23
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
CPC classification number: G06F17/30867
Abstract: 本发明提供了一种获取网页分块的标注规则的方法及装置,其中所述方法包括:A.获取一个以上的网页集合中节点的多页面信息,其中一个节点的多页面信息用于描述该节点在所属网页集合中的分布状况;B.从所述一个以上的网页集合中获取分块样本集;C.利用预设的种子标注规则对所述分块样本集进行标注,以得到训练样本集;D.确定所述训练样本集的分类特征,其中一个训练样本的分类特征至少包括由该训练样本所包含节点的多页面信息构成的多页面特征;E.根据确定的分类特征,对所述训练样本集进行机器学习,以得到机器标注规则。通过上述方式,本发明能够提高对网页分块进行标注的准确性。
-
公开(公告)号:CN103942224B
公开(公告)日:2018-12-14
申请号:CN201310024439.3
申请日:2013-01-23
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明提供了一种获取网页分块的标注规则的方法及装置,其中所述方法包括:A.获取一个以上的网页集合中节点的多页面信息,其中一个节点的多页面信息用于描述该节点在所属网页集合中的分布状况;B.从所述一个以上的网页集合中获取分块样本集;C.利用预设的种子标注规则对所述分块样本集进行标注,以得到训练样本集;D.确定所述训练样本集的分类特征,其中一个训练样本的分类特征至少包括由该训练样本所包含节点的多页面信息构成的多页面特征;E.根据确定的分类特征,对所述训练样本集进行机器学习,以得到机器标注规则。通过上述方式,本发明能够提高对网页分块进行标注的准确性。
-
公开(公告)号:CN105468688A
公开(公告)日:2016-04-06
申请号:CN201510789321.9
申请日:2015-11-17
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/30
Abstract: 本发明实施例提供了一种站点模板的处理方法及装置。一方面,本发明实施例通过获取站点所提供的页面,以作为训练样本;从而,获取模板样式,所述模板样式中定义有至少一个字段;根据与各字段相匹配的字符串,在所述训练样本中进行匹配,以获得所述模板样式中定义的各字段的描述信息;进而,根据所述模板样式和所述模板样式中定义的各字段的描述信息,生成所述站点的站点模板。因此,本发明实施例提供的技术方案能够实现自动生成站点模板,提高了站点模板的生成效率,降低了站点模板的生成成本。
-
-
-
-
-
-