Patent search ap:("科大讯飞股份有限公司") AND inv:"殷保才" Page 2

11.

发明公开
二维图形速算题作答批改方法、装置、设备及存储介质审中-实审

公开(公告)号：CN117789239A

公开(公告)日：2024-03-29

申请号：CN202311564044.2

申请日：2023-11-20

Applicant: 科大讯飞股份有限公司

Inventor： 崔燕平 , 陈明军 , 殷保才 , 吴嘉嘉 , 胡金水 , 殷兵 , 刘聪

IPC: G06V30/42 , G06V30/414 , G06V30/413 , G06V30/226 , G06V30/19 , G06V30/146

Abstract: 本申请公开了一种二维图形速算题作答批改方法、装置、设备及存储介质，获取对纸质作答试卷拍摄的图片，从图片中识别出包含二维图形速算题的二维速算块区域；识别二维速算块区域包含的基础结构，及每一基础结构中包含的字符，基础结构为预先定义的组成二维图形速算题的最小结构单元，字符包括印刷体字符和/或手写体字符；针对识别出的每一基础结构，按照预配置的与基础结构对应的批改规则，结合基础结构包含的字符进行作答批改，得到基础结构的批改结果，由各基础结构的批改结果组成二维图形速算题的第一作答批改结果。本申请无需提前录入试题的答案，通过对二维图形速算题对应图像进行分析，即可实现自动批改，成本更低、泛化性更强。

12.

发明公开
一种文字识别方法、系统以及相关装置审中-实审

公开(公告)号：CN117671707A

公开(公告)日：2024-03-08

申请号：CN202311543468.0

申请日：2023-11-15

Applicant: 科大讯飞股份有限公司

Inventor： 刘辰宇 , 胡金水 , 殷保才 , 殷兵 , 谢名亮

IPC: G06V30/41 , G06V30/19 , G06V30/18 , G06T9/00

Abstract: 本申请公开了一种提供一种文字识别方法、系统以及相关装置，该方法包括：获取待识别图像的初始特征；基于上一解码轮次对应的解码区域，获取当前解码轮次中所述待识别图像对应的解码步长；其中，所述解码区域与所述待识别图像中的部分区域匹配；基于所述解码步长和所述初始特征，获取所述当前解码轮次对应的当前解码特征；基于所述当前解码特征，获取所述当前解码轮次对应的解码文字。通过上述方式，本申请能够提高文字识别的效率和准确性。

13.

发明公开
表格全要素抽取方法、装置、电子设备及存储介质审中-实审

公开(公告)号：CN117612190A

公开(公告)日：2024-02-27

申请号：CN202311362989.6

申请日：2023-10-19

Applicant: 科大讯飞股份有限公司

Inventor： 蒋磊 , 崔瑞莲 , 张建树 , 殷保才 , 殷兵 , 胡金水

IPC: G06V30/412 , G06V30/413

Abstract: 本发明提供一种表格全要素抽取方法、装置、电子设备及存储介质，该方法包括：获取目标表格中各初始单元格和各单元格文本；基于各初始单元格的各第一顶点的位置，确定与初始单元格对应的单元格，并基于各单元格的相对位置确定目标表格的结构信息，单元格之间具有公共的顶点；基于目标表格的结构信息和各单元格文本，确定目标表格中各单元格的属性信息，属性信息包括键或值；基于目标表格的结构信息和各单元格的属性信息，抽取目标表格中的全要素。基于目标表格的结构信息和各单元格的属性信息，可以正确抽取属性信息相对应的各要素，避免抽取的各要素的属性信息不对应的情况，进而可以提高要素抽取的准确度。

14.

发明公开
要素内容抽取方法、装置、电子设备及存储介质

公开(公告)号：CN117576700A

公开(公告)日：2024-02-20

申请号：CN202311512589.9

申请日：2023-11-10

Applicant: 科大讯飞股份有限公司

Inventor： 蒋磊 , 崔瑞莲 , 张建树 , 殷保才 , 殷兵 , 胡金水

IPC: G06V30/19 , G06V30/146 , G06F16/9032 , G06V30/42

Abstract: 本发明提供一种要素内容抽取方法、装置、电子设备及存储介质，该方法包括：获取目标图片中各文本行的文本；分别提取各文本行的文本各自对应的第一句子级token，以及至少一个问题文本对应的第二句子级token，各问题文本包括要素字段；将各第一句子级token和各第二句子级token均输入要素抽取模型，得到要素抽取模型输出的要素字段对应的要素内容。针对文本行整体提取该文本行对应的第一句子级token，可实现第一句子级token与文本行一一对应，因此，有效增加了token表征的文本内容的长度，即使在输入的token总数量受限的情况下，也能输入较长的文本，并能对该文本进行要素内容提取，提高了适用性。

15.

发明授权
图像检测方法以及电子设备、存储装置有权

公开(公告)号：CN113449770B

公开(公告)日：2024-02-13

申请号：CN202110542047.0

申请日：2021-05-18

Applicant: 科大讯飞股份有限公司

Inventor： 程虎 , 殷保才

IPC: G06V10/764 , G06V10/80

Abstract: 本申请公开了一种图像检测方法以及电子设备、存储装置，其中，图像检测方法包括：提取第一模态图像的第一特征图，并提取第二模态图像的第二特征图；其中，第一模态图像和第二模态图像均为对目标对象采集得到的；提取第一特征图中各个第一像素位置的第一位置特征，并提取第二特征图中各个第二像素位置的第二位置特征；将各个第一像素位置的第一位置特征和各个第二像素位置的第二位置特征进行融合，得到模态融合特征；利用模态融合特征进行检测，得

16.

发明公开
视频生成方法、装置、设备和存储介质审中-实审

公开(公告)号：CN117336567A

公开(公告)日：2024-01-02

申请号：CN202311030837.6

申请日：2023-08-14

Applicant: 科大讯飞股份有限公司

Inventor： 高建清 , 左童春 , 姚仕豪 , 何山 , 郜静文 , 杨硕 , 殷保才 , 殷兵 , 刘烨秋 , 付新勇 , 王雨露 , 张若楠 , 管广鹏 , 吕磊 , 陈付国 , 金左雨 , 董飞 , 胡国平 , 刘聪 , 魏思 , 王士进 , 刘权

IPC: H04N21/81 , H04N21/44 , G10L13/027 , G10L13/08

Abstract: 本申请公开了一种视频生成方法、装置、设备和存储介质，其中，视频生成方法包括：获取原始文稿和原始文稿的原始配图；获取响应于原始文稿和原始配图而分析得到且用于配音的参考数据；其中，参考数据包含文案文本、表征文案文本所蕴含情感信息的第一文本和至少表征文案文本需采用发音音色的第二文本；基于参考数据进行语音合成，得到视频配音；至少基于原始配图和视频配音，生成目标视频。上述方案，能够提高视频生成效率，降低视频生成成本。

17.

发明公开
一种人脸识别方法、系统及装置审中-实审

公开(公告)号：CN116486450A

公开(公告)日：2023-07-25

申请号：CN202310295775.5

申请日：2023-03-22

Applicant: 科大讯飞股份有限公司

Inventor： 吴子扬 , 奚昌凤 , 殷保才

IPC: G06V40/16 , G06V10/774 , G06V10/74

Abstract: 本申请公开了一种人脸识别方法、系统及装置，该方法包括：基于人脸识别模型进行人脸识别，得到待识别图像对应的人脸图像特征；模型训练过程包括：构建包含多个样本图像的训练样本集，将样本图像输入人脸识别模型，获得对应的初始图像特征；将初始类别特征的初始值处理为简化值，得到简化类别特征，将初始图像特征的初始值处理为简化值，得到简化图像特征；获得简化图像特征和各个简化类别特征之间的第一相似度，基于第一相似度从所有初始类别特征中获得样本图像对应的多个参考类别特征；基于所有样本图像对应的类别标签、初始图像特征和参考类别特征，调整人脸识别模型中的参数。通过上述方式，本申请能够提高人脸识别准确率，并节省计算成本。

18.

发明公开
一种三维重建方法、装置、边缘设备和存储介质审中-实审

公开(公告)号：CN116051736A

公开(公告)日：2023-05-02

申请号：CN202211703540.7

申请日：2022-12-23

Applicant: 科大讯飞股份有限公司

Inventor： 宋力争 , 殷保才 , 李华清 , 张圆

IPC: G06T17/00

Abstract: 本申请公开了一种三维重建方法、装置、边缘设备和存储介质，该方法包括：获取可见光相机和深度相机对目标对象同步拍摄到的可见光图像和深度图像；基于可见光图像进行稀疏重建，得到稀疏点云数据；其中，稀疏点云数据包含可见光图像中特征点反投影后的第一三维点；基于深度图像在稀疏点云数据中筛选第一三维点，得到第一目标点云数据；至少基于第一目标点云数据进行稠密重建，得到目标对象的三维模型。通过上述方式，本申请能够提高三维重建的效率和精度。

19.

发明公开
人脸跟踪方法、装置、电子设备及存储介质审中-实审

公开(公告)号：CN115810027A

公开(公告)日：2023-03-17

申请号：CN202211457378.5

申请日：2022-11-17

Applicant: 科大讯飞股份有限公司

Inventor： 张亚峰 , 李超龙 , 沙文 , 殷保才

IPC: G06T7/246 , G06T7/50 , G06V10/74 , G06V40/16

Abstract: 本发明提供一种人脸跟踪方法、装置、电子设备及存储介质，所述方法包括：获取视频帧序列中的当前帧，并获取所述当前帧的人脸关键点信息；对所述当前帧的人脸关键点信息与上一帧的人脸关键点信息进行相似度计算，并确定所述相似度是否满足预设需求；若确定所述相似度满足预设需求，则根据获取到的人脸区域深度信息确定需要跟踪的目标，其中所述人脸区域深度信息表示所述当前帧的人脸区域的特征点到摄像设备的实际距离。由于引入了相似度和人脸区域深度信息，使得本发明即使在复杂的场景下，也能实现正确跟踪。

20.

发明公开
情绪识别方法、装置、电子设备和存储介质审中-实审

公开(公告)号：CN115588227A

公开(公告)日：2023-01-10

申请号：CN202211401340.6

申请日：2022-11-09

Applicant: 科大讯飞股份有限公司

Inventor： 邵博 , 奚昌凤 , 沙文 , 殷保才 , 李超龙 , 殷兵 , 胡金水

IPC: G06V40/16 , G06V10/774 , G06V10/82 , G10L25/63

Abstract: 本发明提供一种情绪识别方法、装置、电子设备和存储介质，其中方法包括：确定待识别人员的语音数据和图像数据；基于语音数据和所述图像数据进行情绪识别，得到待识别人员的情绪类别；基于图像数据进行人脸检测，得到待识别人员的嘴部关键点的位置信息，基于嘴部关键点的位置信息，确定待识别人员在情绪类别下的情绪强度，通过多模态的情绪信息实现了高效准确的情绪识别，克服了传统方案中情绪识别精度不高，以及对于算力要求较高，以致应用范围受限的缺陷，能够在不依赖硬件条件的情况下，保证高召回率，提高了情绪识别的精确度和准确率，不仅减少了运行系统的资源占用，还延长了硬件的使用期限，保证了资源的充分利用，降低了运行成本。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification