Patent search ap:("杭州海康威视数字技术股份有限公司") AND inv:"齐昕" Page 1

1.

发明公开
指定人群监控方法、装置和存储介质有权

公开(公告)号：CN110875042A

公开(公告)日：2020-03-10

申请号：CN201810925574.8

申请日：2018-08-14

Applicant: 杭州海康威视数字技术股份有限公司

Inventor： 齐昕

IPC: G10L17/00 , G10L17/02 , G10L17/04 , G10L17/22 , G08B21/02 , G08B21/24

Abstract: 本发明公开了一种指定人群监控方法、装置和存储介质，属于计算机处理领域。方法包括：采集第一终端周围环境的声音，得到第一语音信号；通过第一声音检测模块，检测所述第一语音信号中是否有指定类型的声音，以及通过第一声纹识别模型，检测所述第一语音信号是否为指定用户的声音；当所述第一语音信号为所述指定用户的语音信号，且所述第一语音信号中有指定类型的声音时，向第二终端发送提醒信息。本发明只有检测到指定用户的指定类型的第一语音信号时，才会进行提醒操作，避免了检测到他人指定类型的语音信号造成的误操作，提高了监控的准确性。

2.

发明公开
语音识别方法及其装置和语音识别系统无效

公开(公告)号：CN110767214A

公开(公告)日：2020-02-07

申请号：CN201810848234.X

申请日：2018-07-27

Applicant: 杭州海康威视数字技术股份有限公司

Inventor： 陈展 , 齐昕

IPC: G10L15/02 , G10L15/26 , G10L15/30 , H04N7/18 , H04N5/232

Abstract: 本发明公开了一种语音识别装置及其装置和语音识别系统，该方法包括：对获取的音频信号进行特征提取，得到多个语音特征值；将所述多个语音特征值输入到声学模型中进行识别，得到多个发音音素的概率；根据所述多个发音音素的概率获取其中若干个连续发音音素组成预设关键词的概率；判断组成所述预设关键词的概率是否大于概率阈值，若是，则确定所述音频信号中存在所述预设关键词。该方法可以降低语音识别的计算量，降低应用该识别方法的硬件要求。

3.

发明授权
一种语音识别方法、装置、系统、服务器及存储介质有权

公开(公告)号：CN113611308B

公开(公告)日：2024-05-07

申请号：CN202111048642.5

申请日：2021-09-08

Applicant: 杭州海康威视数字技术股份有限公司

Inventor： 齐昕

IPC: G10L15/25 , G10L15/16 , G10L15/06 , G06V40/20 , G06V10/82 , G06N3/0464 , G06N3/08

Abstract: 本发明实施例提供了一种语音识别方法、装置、系统、服务器及存储介质，所述方法包括：获取会议中多个发言者的发言图像、语音信号以及每个发言者的声纹信息，其中，语音信号包括多个发言者同时发言所产生的语音信号，对发言图像进行识别，确定每个发言者的方位信息以及唇动信息，针对每个发言者，将该发言者的唇动信息、声纹信息、方位信息以及语音信号输入预先训练完成的语音识别模型，得到该发言者对应的文本信息，其中，语音识别模型为基于多用户语音样本训练得到的，多用户语音样本包括每个用户的唇动信息、声纹信息、方位信息以及多用户同时发言所产生的语音信号。由于不需要将语音信号分离，保证了语音信号的完整，提高了语音识别的准确度。

4.

发明公开
一种材料缺陷检测方法和装置审中-实审

公开(公告)号：CN115389514A

公开(公告)日：2022-11-25

申请号：CN202211021485.3

申请日：2022-08-24

Applicant: 杭州海康威视数字技术股份有限公司

Inventor： 齐昕

IPC: G01N21/88 , G01N29/26 , G01N29/44 , G06V10/80

Abstract: 本发明实施例公开了一种材料缺陷检测方法和装置。该方法包括：获取待检测材料的多模态数据，其中，待检测材料的多模态数据包括表面数据和体数据；根据待检测材料的多模态数据，构建待检测材料的融合数据；将待检测材料的融合数据和标准样本材料的融合数据进行特征对比，检测待检测材料的缺陷，其中，标准样本材料为与待检测材料的材料属性相同且不存在缺陷的材料。通过本发明，解决了相关技术中采用单模态不能同时检测材料表面和内部缺陷的技术问题，达到了能够同时检测材料表面和内部的缺陷的技术效果。

5.

发明公开
一种语音识别方法、装置、系统、服务器及存储介质有权

公开(公告)号：CN113611308A

公开(公告)日：2021-11-05

申请号：CN202111048642.5

申请日：2021-09-08

Applicant: 杭州海康威视数字技术股份有限公司

Inventor： 齐昕

IPC: G10L15/25 , G10L15/16 , G10L15/06 , G06K9/00 , G06N3/04 , G06N3/08

Abstract: 本发明实施例提供了一种语音识别方法、装置、系统、服务器及存储介质，所述方法包括：获取会议中多个发言者的发言图像、语音信号以及每个发言者的声纹信息，其中，语音信号包括多个发言者同时发言所产生的语音信号，对发言图像进行识别，确定每个发言者的方位信息以及唇动信息，针对每个发言者，将该发言者的唇动信息、声纹信息、方位信息以及语音信号输入预先训练完成的语音识别模型，得到该发言者对应的文本信息，其中，语音识别模型为基于多用户语音样本训练得到的，多用户语音样本包括每个用户的唇动信息、声纹信息、方位信息以及多用户同时发言所产生的语音信号。由于不需要将语音信号分离，保证了语音信号的完整，提高了语音识别的准确度。

6.

发明公开
超声数据的编码方法、解码方法及电子设备、存储介质审中-实审

公开(公告)号：CN115564849A

公开(公告)日：2023-01-03

申请号：CN202211099131.0

申请日：2022-09-07

Applicant: 杭州海康威视数字技术股份有限公司

Inventor： 齐昕

IPC: G06T9/00 , G06N3/04 , G06N3/08

Abstract: 本申请公开了超声数据的编码方法、解码方法及电子设备、存储介质，涉及超声相控阵检测技术领域，可用于实现超声数据的无损压缩，提高超声数据的压缩准确度。该编码方法包括：获取待压缩的超声数据；将待压缩的超声数据输入到基于深度学习的编码网络，以编码网络对待压缩的超声数据进行压缩，得到压缩后的超声数据；利用预设的码本集对压缩后的超声数据进行编码，得到编码后的超声数据。该解码方法包括：获取待解压的超声数据；将待解压的超声数据输入至基于深度学习的解码网络，以解码网络对待解压的超声数据进行解码，得到解码后的超声数据。

7.

发明授权
安防报警方法、装置、系统及设备有权

公开(公告)号：CN112037820B

公开(公告)日：2023-09-05

申请号：CN201910407304.2

申请日：2019-05-16

Applicant: 杭州海康威视数字技术股份有限公司

Inventor： 齐昕

IPC: G10L25/63 , G08B25/10 , G10L17/00 , G10L25/27

Abstract: 本申请实施例提供了安防报警方法、装置、系统及设备，采集音频流；对上述音频流进行分析，确定上述音频流中是否检测到了目标情绪类型；在上述音频流中检测到了上述目标情绪类型时，向服务器发送报警信息。通过采集音频流实现安防报警，光照因素影响小，能够增加没有光照或者光照不足的情况下安防报警的可靠性。并且通过检测音频流中的目标情绪类型进行报警，相比于检测关键词进行报警的实用性更强，这是因为人在遇到危险时，通常无法正常的进行语音发音，从而导致关键词的识别率大大下降，使得利用关键词进行语音报警的应用变得无效。对语音表达的情绪进行分析，当识别到目标情绪类型时进行报警操作，实际可行性更高。

8.

发明授权
指定人群监控方法、装置和存储介质有权

公开(公告)号：CN110875042B

公开(公告)日：2022-08-16

申请号：CN201810925574.8

申请日：2018-08-14

Applicant: 杭州海康威视数字技术股份有限公司

Inventor： 齐昕

IPC: G10L17/00 , G10L17/02 , G10L17/04 , G10L17/22 , G08B21/02 , G08B21/24

Abstract: 本发明公开了一种指定人群监控方法、装置和存储介质，属于计算机处理领域。方法包括：采集第一终端周围环境的声音，得到第一语音信号；通过第一声音检测模块，检测所述第一语音信号中是否有指定类型的声音，以及通过第一声纹识别模型，检测所述第一语音信号是否为指定用户的声音；当所述第一语音信号为所述指定用户的语音信号，且所述第一语音信号中有指定类型的声音时，向第二终端发送提醒信息。本发明只有检测到指定用户的指定类型的第一语音信号时，才会进行提醒操作，避免了检测到他人指定类型的语音信号造成的误操作，提高了监控的准确性。

9.

发明授权
一种声音获取方法、装置、设备及系统有权

公开(公告)号：CN110767228B

公开(公告)日：2022-06-03

申请号：CN201810826055.6

申请日：2018-07-25

Applicant: 杭州海康威视数字技术股份有限公司

Inventor： 齐昕

IPC: G10L15/25 , G10L15/26 , G10L15/30 , G10L15/34

Abstract: 本发明实施例提供了一种声音获取方法、装置、设备及系统，方法包括：先对人员的唇部图像进行分析，在判断人员存在唇部动作的情况下，再获取声音采集设备采集的声音；可以理解，如果人员存在唇部动作，则人员大概率是在开口说话，这种情况下，再获取声音采集设备采集的声音，减少了仅获取到噪声的概率。

10.

发明公开
安防报警方法、装置、系统及设备有权

公开(公告)号：CN112037820A

公开(公告)日：2020-12-04

申请号：CN201910407304.2

申请日：2019-05-16

Applicant: 杭州海康威视数字技术股份有限公司

Inventor： 齐昕

IPC: G10L25/63 , G08B25/10 , G10L17/00 , G10L25/27

Abstract: 本申请实施例提供了安防报警方法、装置、系统及设备，采集音频流；对上述音频流进行分析，确定上述音频流中是否检测到了目标情绪类型；在上述音频流中检测到了上述目标情绪类型时，向服务器发送报警信息。通过采集音频流实现安防报警，光照因素影响小，能够增加没有光照或者光照不足的情况下安防报警的可靠性。并且通过检测音频流中的目标情绪类型进行报警，相比于检测关键词进行报警的实用性更强，这是因为人在遇到危险时，通常无法正常的进行语音发音，从而导致关键词的识别率大大下降，使得利用关键词进行语音报警的应用变得无效。对语音表达的情绪进行分析，当识别到目标情绪类型时进行报警操作，实际可行性更高。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification