-
公开(公告)号:CN112883183A
公开(公告)日:2021-06-01
申请号:CN202110301600.1
申请日:2021-03-22
Applicant: 北京大学深圳研究院 , 深港产学研基地(北京大学香港科技大学深圳研修院)
IPC: G06F16/332 , G06F16/33 , G06F16/338 , G06F16/35
Abstract: 本发明公开了一种构建多分类模型的方法、智能客服方法和相关装置及系统。构建多分类模型的方法包括:对已标注标签的多轮对话进行预处理得到历史标签流;将历史标签流、当前轮用户请求输入词嵌入层,转换为第一词向量和第二词向量;将第一词向量和第二词向量输入编码层,经不同的编码器进行编码和特征提取,得到标签流特征和当前轮请求特征;将标签流特征和当前轮请求特征输入交互层进行交互,输出对历史信息敏感的用户请求特征;将交互层的输出特征输入分类器进行分类,训练得到用于智能客服系统的多分类模型。本发明使用多个编码器,提高了特征提取能力;使用历史标签流取代文本数据,能够减少噪声;使用多分类模型,有利于提升系统鲁棒性。
-
公开(公告)号:CN107609009B
公开(公告)日:2020-02-18
申请号:CN201710620545.6
申请日:2017-07-26
Applicant: 北京大学深圳研究院 , 深圳报业集团 , 深圳新闻网传媒股份有限公司
Abstract: 本发明涉及一种文本情感分析方法、装置、存储介质和计算机设备。获取测试文本中句子的句向量,句向量是由句子中的词的词向量连接构成,将句向量分别输入到预设的两个卷积神经网络和一个双向长短期记忆神经网络模型进行处理得到句子的三个句子特征向量。将三个句子特征向量连接,通过分类器SVM对连接后的句子特征向量进行分类得到句子的情感分类结果,根据句子的情感分类结果得到测试文本的情感倾向。该方法结合了卷积神经网络能够有效的提取局部特征、双向长短时记忆神经网络能够有效地分析时序特征的优势,通过该方法对测试文本经过情感分析后获取的情感倾向更高的鲁棒性和泛化能力,且更加高效。
-
公开(公告)号:CN117877520A
公开(公告)日:2024-04-12
申请号:CN202311827242.3
申请日:2023-12-27
Applicant: 北京大学深圳研究院
IPC: G10L25/51 , G10L25/03 , G10L25/87 , G10L21/0232
Abstract: 本申请涉及一种声学事件的检测方法、装置、电子设备及存储介质,方法包括:获取待检测音频数据,并确定待检测音频数据对应的至少两个目标增强频谱,其中,每个所述目标增强频谱对应的目标频谱类型不同;对任一所述目标增强频谱进行语音端点检测,确定所述待检测音频数据对应的目标频段;基于所述目标频段和所有所述目标增强频谱,确定所述待检测音频数据对应的声音类型;根据所述目标频段、所述声音类型,以及所有所述目标增强频谱进行声学事件检测,确定所述待检测音频数据对应的声学事件检测结果。由此可以实现提高声学事件检测的准确率和效率。
-
公开(公告)号:CN107808011B
公开(公告)日:2021-04-13
申请号:CN201711155288.X
申请日:2017-11-20
Abstract: 本申请涉及一种信息的分类抽取方法、装置、计算机设备和存储介质,所述方法包括:获取公告信息,利用所述公告信息生成多个文本块;获取分类器,利用所述分类器对多个文本块进行分类,对分类后的文本块添加类别标签;根据所述类别标签对分类后的文本块进行分割,得到多个分割块;对多个类别标签对应的分割块进行筛选;计算与类别标签对应的筛选出的分割块之间的相关性,根据所述相关性对筛选出的分割块进行抽取;利用抽取到的分割块组成抽取结果信息。采用本方法能够提高信息抽取的效率。
-
公开(公告)号:CN106303644B
公开(公告)日:2020-03-31
申请号:CN201610810063.2
申请日:2016-09-08
Applicant: 康佳集团股份有限公司 , 北京大学深圳研究院
IPC: H04N21/422
Abstract: 本发明涉及电视遥控技术领域,公开了一种语音遥控器及其语音采集的方法、系统,所述方法包括:当语音遥控器中的压力传感器感应到的压力超过阈值时,开启处于关闭状态的距离传感器、开关按钮、录音模块以及缓存模块;当距离传感器检测手指到开关按钮的距离小于预定值时,控制录音模块开始录音,并将语音数据记录在缓存模块中;当开关按钮被按下时,控制传输模块将语音数据传输到智能电视或者云端语音识别引擎上进行语音识别。本发明的语音采集方法通过在用户按下录音开关按钮之前就开始了录音,可以有效防止用户在按下录音开关按钮之前就已经录音的语音丢失,便于识别设备通过完整的录音更好的识别,为用户提供方便。
-
公开(公告)号:CN107943911A
公开(公告)日:2018-04-20
申请号:CN201711155534.1
申请日:2017-11-20
CPC classification number: G06F17/30563 , G06F17/218 , G06F17/30507 , G06N3/0472
Abstract: 本发明涉及一种数据抽取方法、装置、计算机设备及可读存储介质。一种数据抽取方法,包括:将待处理数据进行分割得到数据集;将数据集输入预设神经网络模型得到初始抽取数据以及与初始抽取数据对应的特征标签;根据预设规则模板,从初始抽取数据中抽取对应的目标抽取数据;将目标抽取数据以及与目标抽取数据对应的特征标签关联输出。上述数据抽取方法,在抽取不同格式的数据时,不受抽取规则的限制,将数据集与特征标签的映射关系通过定制的抽取规则进行数据抽取,能够降低抽取不同格式数据时的错误率,抽取效果更好。
-
公开(公告)号:CN107609009A
公开(公告)日:2018-01-19
申请号:CN201710620545.6
申请日:2017-07-26
Applicant: 北京大学深圳研究院 , 深圳报业集团 , 深圳新闻网传媒股份有限公司
Abstract: 本发明涉及一种文本情感分析方法、装置、存储介质和计算机设备。获取测试文本中句子的句向量,句向量是由句子中的词的词向量连接构成,将句向量分别输入到预设的两个卷积神经网络和一个双向长短期记忆神经网络模型进行处理得到句子的三个句子特征向量。将三个句子特征向量连接,通过分类器SVM对连接后的句子特征向量进行分类得到句子的情感分类结果,根据句子的情感分类结果得到测试文本的情感倾向。该方法结合了卷积神经网络能够有效的提取局部特征、双向长短时记忆神经网络能够有效地分析时序特征的优势,通过该方法对测试文本经过情感分析后获取的情感倾向更高的鲁棒性和泛化能力,且更加高效。
-
公开(公告)号:CN106303644A
公开(公告)日:2017-01-04
申请号:CN201610810063.2
申请日:2016-09-08
Applicant: 康佳集团股份有限公司 , 北京大学深圳研究院
IPC: H04N21/422
Abstract: 本发明涉及电视遥控技术领域,公开了一种语音遥控器及其语音采集的方法、系统,所述方法包括:当语音遥控器中的压力传感器感应到的压力超过阈值时,开启处于关闭状态的距离传感器、开关按钮、录音模块以及缓存模块;当距离传感器检测手指到开关按钮的距离小于预定值时,控制录音模块开始录音,并将语音数据记录在缓存模块中;当开关按钮被按下时,控制传输模块将语音数据传输到智能电视或者云端语音识别引擎上进行语音识别。本发明的语音采集方法通过在用户按下录音开关按钮之前就开始了录音,可以有效防止用户在按下录音开关按钮之前就已经录音的语音丢失,便于识别设备通过完整的录音更好的识别,为用户提供方便。
-
-
-
-
-
-
-