-
公开(公告)号:CN107886955B
公开(公告)日:2021-10-26
申请号:CN201610865036.5
申请日:2016-09-29
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明实施例公开了一种语音会话样本的身份识别方法、装置及设备。该方法包括:识别语音会话样本的声学特征,并依据识别结果,确定所述语音会话样本中包含的会话语句;依据所述语音会话样本中包含的会话语句的声学特征,对不同用户的会话语句进行聚类;将每一用户的会话语句翻译成会话文本,并基于预先训练得到的身份分类器,确定所述每一用户的身份信息。本发明实施例的技术方案,实现了对语音会话样本中不同会话语句所属用户的身份识别,为后续为不同身份用户提供个性化服务奠定了基础。
-
公开(公告)号:CN107886955A
公开(公告)日:2018-04-06
申请号:CN201610865036.5
申请日:2016-09-29
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明实施例公开了一种语音会话样本的身份识别方法、装置及设备。该方法包括:识别语音会话样本的声学特征,并依据识别结果,确定所述语音会话样本中包含的会话语句;依据所述语音会话样本中包含的会话语句的声学特征,对不同用户的会话语句进行聚类;将每一用户的会话语句翻译成会话文本,并基于预先训练得到的身份分类器,确定所述每一用户的身份信息。本发明实施例的技术方案,实现了对语音会话样本中不同会话语句所属用户的身份识别,为后续为不同身份用户提供个性化服务奠定了基础。
-
公开(公告)号:CN108090104B
公开(公告)日:2023-05-02
申请号:CN201611056317.2
申请日:2016-11-23
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F16/958
Abstract: 本申请公开了用于获取网页信息的方法和装置。所述方法的一具体实施方式包括:解析目标网站中的网页,生成所述网页的结构树,从所述结构树的节点中提取至少一个网页元素,生成网页元素集合;对所述网页元素集合中的每个网页元素,确定该网页元素包含预设关键词库中的关键词的数量;根据各个网页元素包含的关键词的数量,在所述网页元素集合中选取出网页元素作为待提取网页元素,并由所选取的待提取网页元素生成信息提取模板;利用所述信息提取模板将所述目标网站中的网页的网页内容转换为结构化数据,从所述结构化数据中获取所述网页的信息。该实施方法实现了自动提取网页的信息。
-
公开(公告)号:CN107886951A
公开(公告)日:2018-04-06
申请号:CN201610865051.X
申请日:2016-09-29
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明实施例公开了一种语音检测方法、装置及设备。该方法包括:依据语音会话样本确定设定身份用户的语音内容;将所述设定身份用户的语音内容转化成文本内容;依据预先训练得到的问题识别模型,确定所述文本内容是否包含异常问题,其中所述问题识别模型是依据问题文本内容训练得到的。本发明实施例提供的技术方案,实现了语音质量的自动检测,相比于现有的通过人工进行语音质量检测,提高了语音检测效率以及异常问题的检出率。
-
公开(公告)号:CN107784301A
公开(公告)日:2018-03-09
申请号:CN201610794963.2
申请日:2016-08-31
Applicant: 百度在线网络技术(北京)有限公司
CPC classification number: G06K9/20 , G06K9/2054 , G06K9/4604 , G06K9/4652 , G06K2209/01
Abstract: 本申请公开了用于识别图像中文字区域的方法和装置。所述方法的一具体实施方式包括:获取待识别的图像中的各个像素点的颜色值和位置信息;基于所述各个像素点的颜色值,对所述像素点进行聚类,其中每个像素点类别中的像素点的颜色值相同或相似;针对聚类处理后的每类像素点,确定由该类像素点中的像素点构成的各个连通区域的轮廓,得到轮廓集合;基于所述轮廓集合中的各个轮廓的颜色值和位置信息,对所述各个轮廓进行合并,以得到所述图像中的各个文字区域。该实施方式提高了图像文字识别中文字行顺序识别的准确率。
-
公开(公告)号:CN107784301B
公开(公告)日:2021-06-11
申请号:CN201610794963.2
申请日:2016-08-31
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了用于识别图像中文字区域的方法和装置。所述方法的一具体实施方式包括:获取待识别的图像中的各个像素点的颜色值和位置信息;基于所述各个像素点的颜色值,对所述像素点进行聚类,其中每个像素点类别中的像素点的颜色值相同或相似;针对聚类处理后的每类像素点,确定由该类像素点中的像素点构成的各个连通区域的轮廓,得到轮廓集合;基于所述轮廓集合中的各个轮廓的颜色值和位置信息,对所述各个轮廓进行合并,以得到所述图像中的各个文字区域。该实施方式提高了图像文字识别中文字行顺序识别的准确率。
-
公开(公告)号:CN107886951B
公开(公告)日:2021-07-23
申请号:CN201610865051.X
申请日:2016-09-29
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本发明实施例公开了一种语音检测方法、装置及设备。该方法包括:依据语音会话样本确定设定身份用户的语音内容;将所述设定身份用户的语音内容转化成文本内容;依据预先训练得到的问题识别模型,确定所述文本内容是否包含异常问题,其中所述问题识别模型是依据问题文本内容训练得到的。本发明实施例提供的技术方案,实现了语音质量的自动检测,相比于现有的通过人工进行语音质量检测,提高了语音检测效率以及异常问题的检出率。
-
公开(公告)号:CN109166120A
公开(公告)日:2019-01-08
申请号:CN201811054409.6
申请日:2018-09-11
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请实施例公开了用于获取信息的方法及装置。该方法的一具体实施方式包括:获取待处理图像,上述待处理图像包含皮肤病症图像;将上述待处理图像导入预先训练的病症识别模型,得到病症信息,其中,上述病症识别模型用于表征待处理图像与病症信息之间的对应关系,上述病症信息包括用于标识病症的病症标记图像和病症识别信息,上述病症标记图像包括标记方框和位于标记方框内的皮肤病症图像。该实施方式提高了获取病症信息的准确性。
-
公开(公告)号:CN108205526A
公开(公告)日:2018-06-26
申请号:CN201611188215.6
申请日:2016-12-20
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/27
Abstract: 本发明的目的是提供一种确定综合语义信息的方法与装置。其中,本发明获得用户所提供的输入信息以及该用户所在场景的场景图像信息,并根据所获得的场景图像信息,确定该用户所在场景的场景标识信息,进而结合所确定的场景标识信息,对输入信息进行语义分析处理,以确定该输入信息所对应的综合语义信息。本发明通过确定用户所在场景的场景标识信息,并结合该场景标识信息对用户所提供的输入信息进行语义分析处理,从而可以确定该输入信息在当前用户所在场景下所对应的综合语义信息。因此,本发明可以提高语义分析的准确性,更好地理解用户所输入的信息,从而可以更准确地与用户对话,提高用户的使用体验。
-
公开(公告)号:CN107784033A
公开(公告)日:2018-03-09
申请号:CN201610798166.1
申请日:2016-08-31
Applicant: 百度在线网络技术(北京)有限公司
CPC classification number: G06F17/30654 , G06N5/022
Abstract: 本发明的目的是提供一种基于会话进行实时推荐的方法和装置,基于当前用户与其当前客户之间的当前会话,根据所述当前客户的属性信息,自知识库中匹配获得与所述当前会话中的当前问题对应的推荐答案;将所述推荐答案提供给所述当前用户;其中,所述知识库中的知识的结构包括 ;与现有技术相比,本发明有效地利用了现有知识,方便当前用户来解答当前客户的询问,提升了用户的使用体验。
-
-
-
-
-
-
-
-
-