-
公开(公告)号:CN118485785B
公开(公告)日:2024-09-24
申请号:CN202410948625.4
申请日:2024-07-16
Applicant: 科大讯飞股份有限公司 , 浙江潮汐力科技有限公司
Abstract: 本发明涉及图像处理技术领域,提供一种三维重建方法、装置、电子设备和存储介质,其中方法包括:获取至少两个视角图像;基于至少两个视角图像的视角图特征之间的相关性,对各视角图特征进行特征增强,得到各视角图像的增强图特征,并基于各视角图像的增强图特征,进行深度预测,得到预测深度范围;将预测深度范围作为立体匹配算法的初始深度范围,应用立体匹配算法在至少两个视角图像的基础上进行三维重建。本发明提供的方法、装置、电子设备和存储介质,将预测深度范围作为初始深度范围,能够缩小初始深度范围与真实深度情况之间的误差,提高在三维重建的迭代优化效率,降低陷入局部最优解的风险,由此提高三维重建效率,保证三维重建质量。
-
公开(公告)号:CN119689187A
公开(公告)日:2025-03-25
申请号:CN202411882976.6
申请日:2024-12-19
Applicant: 科大讯飞股份有限公司
IPC: G01R31/12
Abstract: 本发明提供一种局部放电检测方法、装置、电子设备和存储介质,其中方法包括:获取待检测的电力设备的放电声音信号;基于放电声音信号的放电周期性特征,对放电声音信号进行滑窗滤波,得到多个放电声音信号分量;基于各放电声音信号分量对应的频段的局部放电特征频率能量进行局部放电检测,得到局部放电检测结果,克服了传统方案中因环境干扰导致无法准确有效进行局部放电检测的缺陷,利用局部放电的机理特征,结合滑窗滤波方法进行局部放电检测,能够抑制环境中大部分的干扰因素,准确进行是否局部放电的判断,得到准确可靠的局部放电检测结果,提升了检测的准确性和可信度。
-
公开(公告)号:CN119782899A
公开(公告)日:2025-04-08
申请号:CN202411754118.3
申请日:2024-12-02
Applicant: 科大讯飞股份有限公司 , 合肥智能语音创新发展有限公司 , 浙江潮汐力科技有限公司
IPC: G06F18/241 , G06F18/213 , G06F18/25 , G06V10/42 , G06V10/44 , G06N3/045 , G06N3/0464 , G06N3/0895 , G10L25/30 , G10L25/51 , G06F123/02
Abstract: 本发明提供一种设备状态识别方法、装置、电子设备和存储介质,其中方法包括:对待测设备的音频数据进行特征提取,得到音频特征,并对所述待测设备的图像数据进行特征提取,得到图像特征;将所述音频特征和所述图像特征输入至设备状态识别模型,得到所述设备状态识别模型输出的状态识别结果。本发明通过同时利用音频特征和图像特征进行设备状态识别,可以使模型捕捉到设备状态更全面、更丰富的信息,从而提高识别的准确性和鲁棒性,通过在模型中引入全局注意力模块和局部注意力模块,增加了多重注意力机制,可以有效去除冗余信息,并从全时域、全频域和局部细节三个层面上提升特征的表征能力,进一步提高识别的准确性和泛化能力。
-
公开(公告)号:CN118485785A
公开(公告)日:2024-08-13
申请号:CN202410948625.4
申请日:2024-07-16
Applicant: 科大讯飞股份有限公司 , 浙江潮汐力科技有限公司
Abstract: 本发明涉及图像处理技术领域,提供一种三维重建方法、装置、电子设备和存储介质,其中方法包括:获取至少两个视角图像;基于至少两个视角图像的视角图特征之间的相关性,对各视角图特征进行特征增强,得到各视角图像的增强图特征,并基于各视角图像的增强图特征,进行深度预测,得到预测深度范围;将预测深度范围作为立体匹配算法的初始深度范围,应用立体匹配算法在至少两个视角图像的基础上进行三维重建。本发明提供的方法、装置、电子设备和存储介质,将预测深度范围作为初始深度范围,能够缩小初始深度范围与真实深度情况之间的误差,提高在三维重建的迭代优化效率,降低陷入局部最优解的风险,由此提高三维重建效率,保证三维重建质量。
-
公开(公告)号:CN119763604A
公开(公告)日:2025-04-04
申请号:CN202411610719.7
申请日:2024-11-12
Applicant: 科大讯飞股份有限公司 , 合肥智能语音创新发展有限公司 , 浙江潮汐力科技有限公司
Abstract: 本发明提供一种变压器状态识别方法、装置、电子设备和存储介质,涉及电力技术领域,其中方法包括:获取变压器的待测音频数据;将待测音频数据输入声纹提取模型中,得到声纹提取模型输出的目标声纹;声纹提取模型是基于第一数量的第一样本变压器的无状态标签的第一样本音频数据训练得到的;基于目标声纹和至少一个注册声纹,对变压器的状态进行识别。本发明是先基于大量无状态标签的第一样本音频数据训练得到声纹提取模型,再通过声纹提取模型基于少量有状态标签的第二样本音频数据确定至少一个注册声纹,进而结合注册声纹实现变压器的状态识别,在只需要少量有状态标签的样本音频数据的情况下,提高了变压器状态识别的准确性。
-
公开(公告)号:CN119024257A
公开(公告)日:2024-11-26
申请号:CN202310619029.7
申请日:2023-05-26
Applicant: 科大讯飞股份有限公司
Inventor: 李俊 , 宫韬 , 蔡明琦 , 杨杰 , 刘铱豪 , 马旭 , 宋若淼 , 翟晓伟 , 刘颖 , 车骋 , 徐甲甲 , 李心 , 储汉卿 , 任颖 , 苏海涛 , 梁华 , 胡琼英 , 方昕 , 高建清 , 刘聪 , 胡国平
Abstract: 本申请公开了一种声源成像系统的性能测试方法以及相关装置,该方法包括:使两个测试声源分别与声源成像系统之间具有第一预设距离;两个测试声源分别相对声源成像系统具有相同的第一预设俯仰角和不同的第一预设方位角,且两个第一预设方位角差值的绝对值为180°;使两个测试声源同时发出声波,声源成像系统获得两个测试声源的第一检测结果;其中,第一检测结果包括对应测试声源的第一测试俯仰角和第一测试方位角;基于两个测试声源的第一检测结果、以及相应的第一预设俯仰角和第一预设方位角判定声源成像系统的分辨率精度是否符合对应的要求。通过上述方式,本申请能够高效准确地判断声源成像系统对于多声源的定位是否准确。
-
公开(公告)号:CN307949231S
公开(公告)日:2023-04-04
申请号:CN202230645709.2
申请日:2022-09-28
Applicant: 科大讯飞股份有限公司
Abstract: 1.本外观设计产品的名称:显示屏幕面板的语音融合调度管理图形用户界面。
2.本外观设计产品的用途:用于交互和显示。
3.本外观设计产品的设计要点:在于图形用户界面。
4.最能表明设计要点的图片或照片:界面变化状态图1。
5.其他视图无设计要点,省略其他视图。
6.图形用户界面的用途:用于煤矿指挥调度过程中的智能语音录入识别、语音呼叫、语音应答、语音挂断、语音转写。
7.图形用户界面的人机交互方式:主视图为语音融合调度的登录首界面;在主视图的输入框中输入账号和密码后,点击“登录”按钮,跳转至界面变化状态图1展示的“通讯列表”模块下展示的通讯录界面;点击界面变化状态图1下方通讯栏中的电话图标按钮后,在提示框中输入号码后,点击提示框下方的“语音呼叫”按钮,跳转至界面变化状态图2展示的语音通话界面;点击界面变化状态图1‑2中任一标题栏中的“呼叫记录”模块,跳转至界面变化状态图3展示的呼叫记录详情界面;点击界面变化状态图1‑3中任一标题栏中的“通讯管理”模块,跳转至界面变化状态图4展示的通讯录管理详情界面,并在通讯录管理详情界面中展示对应通话记录中的语音转写内容。
8.显示屏幕面板可用于手机、平板电脑、笔记本电脑、台式机。
-
-
-
-
-
-