对话文本摘要生成方法、装置、电子设备和存储介质

    公开(公告)号:CN111400489B

    公开(公告)日:2022-12-02

    申请号:CN202010269479.4

    申请日:2020-04-08

    IPC分类号: G06F16/34

    摘要: 本发明实施例提供一种对话文本摘要生成方法、装置、电子设备和存储介质,其中方法包括:确定对话文本;将所述对话文本中每一发言人对应的分句输入至对话文本摘要模型中,得到所述对话文本摘要模型输出的所述对话文本对应的摘要;所述对话文本摘要模型用于确定所述对话文本中每一发言人的先验发言人特征表示,并基于所述对话文本中每一发言人对应的分句和先验发言人特征表示,生成所述对话文本对应的摘要;所述对话文本摘要模型是基于样本对话文本中每一发言人对应的样本分句,以及所述样本对话文本的样本摘要训练得到的。本发明实施例提供的对话文本摘要生成方法、装置、电子设备和存储介质,提高了对话文本摘要生成的准确性。

    应用于电子稳像的改进块匹配算法

    公开(公告)号:CN103237156A

    公开(公告)日:2013-08-07

    申请号:CN201310128322.X

    申请日:2013-04-02

    IPC分类号: H04N5/14 G06T7/20

    摘要: 本发明涉及一种应用于电子稳像的改进块匹配算法,如下:用块匹配进行运动估计,主要包括匹配块大小的确定、有效块的判断、匹配的准则,采用中心扩展搜索算法及全局运动向量的计算。中心扩展搜索算法,根据帧间实际偏移大小调整搜索范围,快速准确定位块的偏移。由每个块偏移情况得到各块局部运动向量,经随机抽样一致性处理,筛选出最可靠的一部分局部运动向量,再由最小二乘法确定帧间相似变换模型参数。本发明减小了计算量,提高了搜索速度。相比基于最小中心偏置特性的快速搜索法,能处理更大范围的帧间偏移。本发明可应用于摄像机、计算机视频播放以及车载稳像装置等应用电子稳像技术的场合,具有精度高、速度快、适应性强的优点。

    一种在输电线路末端注入无功电流的融冰装置

    公开(公告)号:CN101557090A

    公开(公告)日:2009-10-14

    申请号:CN200910072079.8

    申请日:2009-05-21

    IPC分类号: H02G7/16

    摘要: 一种在输电线路末端注入无功电流的融冰装置,属于高压输电系统领域,本发明的目的是解决采用电容补偿电感调负融冰方法存在大容量可调电感没有成型设备,设备投资大的问题。本发明的输电线路的两端分别设置第一隔离开关和第二隔离开关,它还包括近端融冰隔离开关、远端融冰隔离开关和无功补偿装置,无功补偿装置与近端融冰隔离开关的一端相连,第一隔离开关和输电线路近端的连接点与融冰隔离开关的另一端相连,第二隔离开关和输电线路远端的连接点与远端融冰隔离开关的一端相连,远端融冰隔离开关的另一端与远端变压器副边母线相连。本发明用于高压线路融冰。

    一种基于卷积神经网络的激光焊接状态判别方法

    公开(公告)号:CN117464182A

    公开(公告)日:2024-01-30

    申请号:CN202311765994.1

    申请日:2023-12-21

    IPC分类号: B23K26/21 B23K26/046 B25J9/16

    摘要: 一种基于卷积神经网络的激光焊接状态判别方法,涉及焊接技术领域。为了解决现有的激光焊接状态判别方法在面对复杂焊接状态时依赖于单一信息进行判别、准确率低、精度低、需要人工参与、焊缝的不良率高的缺陷,通过预实验采集激光焊接过程中的激光羽辉和熔池形貌;通过三维卷积神经网络分别处理激光羽辉和熔池形貌,获得特征向量;通过权重融合将对应于激光羽辉和熔池形貌的特征向量进行融合,采用全连接层对焊接状态进行区分;对三维卷积神经网络进行训练,获得每一个全连接层的输出结果,并对每个输出结果进行变换,根据变换后的最大值所对应的焊接状态作为最终的诊断结果。本发明主要用于对激光焊接状态进行判别。

    一种基于音频质量评估与RNN状态预测的低算力需求嵌入式语音增强方法

    公开(公告)号:CN117253475A

    公开(公告)日:2023-12-19

    申请号:CN202311297956.8

    申请日:2023-10-09

    摘要: 本发明公开了一种基于音频质量评估与RNN状态判别的低算力需求嵌入式语音增强方法,包括:训练语音音频质量评估模型、设定质量阈值、训练语音增强模型,同时训练状态更新预测器、得到当前质量阈值条件下的,低算力需求的语音增强模型用于测试,测试时使用状态更新预测器进行Bi‑RNN的状态更新。其中语音音频质量评估模型,用于找出无语音及高质量语音片段跳过处理,减少计算;状态更新预测器用于替换原始的Bi‑RNN状态更新方式,大幅减少算力需求和计算成本。采用本发明,可解决现有嵌入式设备语音增强,算力需求高、处理效果差的问题。

    基于混合信息输入网络模型的未知物体抓取位姿估计方法

    公开(公告)号:CN108280856B

    公开(公告)日:2021-05-07

    申请号:CN201810139292.5

    申请日:2018-02-09

    IPC分类号: G06T7/73

    摘要: 基于混合信息输入网络模型的未知物体抓取位姿估计方法,属于机器人自主抓取领域。本发明为了实现机器人对未知物体的快速、有效抓取。对训练图像数据集中的图像混合信息进行预处理;构建基于混合信息输入的信息融合机制,并搭建神经网络模型;对包含混合信息融合机制的网络模型参数进行训练,获得优化后的混合信息输入网络模型;利用基于RGB‑D图像的物体分割技术实现对传感器采集到的场景图像进行可抓取物体分割;利用基于反馈信息的候选区域生成机制,搜索获得物体上的最佳抓取区域;利用深度信息估计机器人在最佳抓取区域的抓取位置和抓取姿态,进而获得抓取物体时的抓取位姿。该方法有利于机器人快速、准确地实现对未知物体的自主抓取。

    一种基于FPGA的双目图像特征提取、匹配与深度解算的硬件加速方法及系统

    公开(公告)号:CN117953229A

    公开(公告)日:2024-04-30

    申请号:CN202410173554.5

    申请日:2024-02-07

    摘要: 本发明提供了一种基于FPGA的双目图像特征提取、匹配与深度解算的硬件加速方法及系统,属于图像处理硬件加速技术领域。为了解决传统算法全部依赖CPU算力且频繁进行内存读写操作导致的过度占用CPU资源与建图实时性差的问题。本发明利用FPGA适用于具有一定深度的流水线算法的特点,对来自双目相机的图像数据进行实时、同步处理,极大提升了SLAM算法的性能,尤其是解决了SLAM算法中前端特征提取、检测以及立体视觉深度解算占用过多CPU资源,进而导致算法综合性能下降的问题,本发明不仅大幅度降低了算法的延迟,减轻CPU负担,并且具备低功耗的特点,有较高的实际应用价值。

    一种面向自然场景的三维物体模型检索方法

    公开(公告)号:CN111179440B

    公开(公告)日:2023-04-14

    申请号:CN202010003676.1

    申请日:2020-01-02

    IPC分类号: G06T19/20 G06T15/00

    摘要: 一种面向自然场景的三维物体模型检索方法,本发明属于图像处理技术领域。本发明为解决自然图像与多视角表达的三维模型存在的数据领域差异,实现自然图像对多视角三维物体的检索。技术要点:模型的多视角投影与渲染;构建跨领域检索网络;构建三元组立体损失训练数据;训练自然图像到多视角模型映射的网络;自然图像的模型检索。本发明所提出的面向自然场景的三维物体模型检索方法的检索正确率达到94.8%。该方法有效解决了自然图像检索三维物体模型问题,在增强现实和计算机辅助设计等领域,具有广泛的应用前景。