一种语音会话样本的身份识别方法、装置及设备

    公开(公告)号:CN107886955B

    公开(公告)日:2021-10-26

    申请号:CN201610865036.5

    申请日:2016-09-29

    Abstract: 本发明实施例公开了一种语音会话样本的身份识别方法、装置及设备。该方法包括:识别语音会话样本的声学特征,并依据识别结果,确定所述语音会话样本中包含的会话语句;依据所述语音会话样本中包含的会话语句的声学特征,对不同用户的会话语句进行聚类;将每一用户的会话语句翻译成会话文本,并基于预先训练得到的身份分类器,确定所述每一用户的身份信息。本发明实施例的技术方案,实现了对语音会话样本中不同会话语句所属用户的身份识别,为后续为不同身份用户提供个性化服务奠定了基础。

    推广效果数据的获取方法及装置

    公开(公告)号:CN104657882A

    公开(公告)日:2015-05-27

    申请号:CN201510065372.7

    申请日:2015-02-06

    Abstract: 本发明提供一种推广效果数据的获取方法及装置。本发明实施例通过确定推广对象,进而根据用户的搜索需求,获取所述推广对象的至少一个推广点击序列,所述至少一个推广点击序列中每个推广点击序列包括所述推广对象的点击数据,使得能够根据所述至少一个推广点击序列,获得所述推广对象的推广效果数据,由于所获得的推广对象的推广效果数据能够反映推广对象最终是否被用户所选择的相关情况这一推广效果,使得基本满足推广者更加关注的评估意图,从而提高了推广效果的评估结果的利用率。

    用于获取网页信息的方法和装置

    公开(公告)号:CN108090104A

    公开(公告)日:2018-05-29

    申请号:CN201611056317.2

    申请日:2016-11-23

    Abstract: 本申请公开了用于获取网页信息的方法和装置。所述方法的一具体实施方式包括:解析目标网站中的网页,生成所述网页的结构树,从所述结构树的节点中提取至少一个网页元素,生成网页元素集合;对所述网页元素集合中的每个网页元素,确定该网页元素包含预设关键词库中的关键词的数量;根据各个网页元素包含的关键词的数量,在所述网页元素集合中选取出网页元素作为待提取网页元素,并由所选取的待提取网页元素生成信息提取模板;利用所述信息提取模板将所述目标网站中的网页的网页内容转换为结构化数据,从所述结构化数据中获取所述网页的信息。该实施方法实现了自动提取网页的信息。

    用于识别图像中文字区域的方法和装置

    公开(公告)号:CN107784301B

    公开(公告)日:2021-06-11

    申请号:CN201610794963.2

    申请日:2016-08-31

    Abstract: 本申请公开了用于识别图像中文字区域的方法和装置。所述方法的一具体实施方式包括:获取待识别的图像中的各个像素点的颜色值和位置信息;基于所述各个像素点的颜色值,对所述像素点进行聚类,其中每个像素点类别中的像素点的颜色值相同或相似;针对聚类处理后的每类像素点,确定由该类像素点中的像素点构成的各个连通区域的轮廓,得到轮廓集合;基于所述轮廓集合中的各个轮廓的颜色值和位置信息,对所述各个轮廓进行合并,以得到所述图像中的各个文字区域。该实施方式提高了图像文字识别中文字行顺序识别的准确率。

    一种语音检测方法、装置及设备

    公开(公告)号:CN107886951B

    公开(公告)日:2021-07-23

    申请号:CN201610865051.X

    申请日:2016-09-29

    Abstract: 本发明实施例公开了一种语音检测方法、装置及设备。该方法包括:依据语音会话样本确定设定身份用户的语音内容;将所述设定身份用户的语音内容转化成文本内容;依据预先训练得到的问题识别模型,确定所述文本内容是否包含异常问题,其中所述问题识别模型是依据问题文本内容训练得到的。本发明实施例提供的技术方案,实现了语音质量的自动检测,相比于现有的通过人工进行语音质量检测,提高了语音检测效率以及异常问题的检出率。

    推广效果数据的获取方法及装置

    公开(公告)号:CN104657882B

    公开(公告)日:2018-07-13

    申请号:CN201510065372.7

    申请日:2015-02-06

    Abstract: 本发明提供一种推广效果数据的获取方法及装置。本发明实施例通过确定推广对象,进而根据用户的搜索需求,获取所述推广对象的至少一个推广点击序列,所述至少一个推广点击序列中每个推广点击序列包括所述推广对象的点击数据,使得能够根据所述至少一个推广点击序列,获得所述推广对象的推广效果数据,由于所获得的推广对象的推广效果数据能够反映推广对象最终是否被用户所选择的相关情况这一推广效果,使得基本满足推广者更加关注的评估意图,从而提高了推广效果的评估结果的利用率。

    一种确定综合语义信息的方法与装置

    公开(公告)号:CN108205526A

    公开(公告)日:2018-06-26

    申请号:CN201611188215.6

    申请日:2016-12-20

    Abstract: 本发明的目的是提供一种确定综合语义信息的方法与装置。其中,本发明获得用户所提供的输入信息以及该用户所在场景的场景图像信息,并根据所获得的场景图像信息,确定该用户所在场景的场景标识信息,进而结合所确定的场景标识信息,对输入信息进行语义分析处理,以确定该输入信息所对应的综合语义信息。本发明通过确定用户所在场景的场景标识信息,并结合该场景标识信息对用户所提供的输入信息进行语义分析处理,从而可以确定该输入信息在当前用户所在场景下所对应的综合语义信息。因此,本发明可以提高语义分析的准确性,更好地理解用户所输入的信息,从而可以更准确地与用户对话,提高用户的使用体验。

    用于获取网页信息的方法和装置

    公开(公告)号:CN108090104B

    公开(公告)日:2023-05-02

    申请号:CN201611056317.2

    申请日:2016-11-23

    Abstract: 本申请公开了用于获取网页信息的方法和装置。所述方法的一具体实施方式包括:解析目标网站中的网页,生成所述网页的结构树,从所述结构树的节点中提取至少一个网页元素,生成网页元素集合;对所述网页元素集合中的每个网页元素,确定该网页元素包含预设关键词库中的关键词的数量;根据各个网页元素包含的关键词的数量,在所述网页元素集合中选取出网页元素作为待提取网页元素,并由所选取的待提取网页元素生成信息提取模板;利用所述信息提取模板将所述目标网站中的网页的网页内容转换为结构化数据,从所述结构化数据中获取所述网页的信息。该实施方法实现了自动提取网页的信息。

    基于决策树的人机交互方法、装置、计算机设备及介质

    公开(公告)号:CN109273101A

    公开(公告)日:2019-01-25

    申请号:CN201811032869.9

    申请日:2018-09-05

    Abstract: 本申请提出的基于决策树的人机交互方法中,通过对用户输入的诊疗请求进行解析处理,确定所述诊疗请求中包含的第一关键信息;根据所述第一关键信息与预设的决策树中每个节点对应的特征集的匹配度,确定第一目标节点;向所述用户返回与所述第一目标节点对应的第一询问消息;获取所述用户返回的第一应答消息;判断所述预设的决策树中是否包含与所述第一应答消息对应的第二目标节点;若无,则根据所述第一目标节点的特征集及所述第一应答消息,生成待向所述用户返回的诊疗建议。由此,在第一次获取到用户的请求时,即可利用预设的决策树,对用户进行引导诊断,从而为用户提供准确的诊疗建议,节省了用户的时间及精力,并且适用性较强。

Patent Agency Ranking