一种语音识别方法及装置
    51.
    发明公开

    公开(公告)号:CN117392984A

    公开(公告)日:2024-01-12

    申请号:CN202311533155.7

    申请日:2023-11-16

    Inventor: 苏传志 刘明 李雪

    Abstract: 本申请公开了一种语音识别方法及装置,该语音识别方法包括:获取待识别的语音信息;对所述待识别的语音信息进行分段处理,获得分段处理结果,其中,所述分段处理结果至少包括:人物序号及起止时间戳;基于所述分段处理结果,对所述待识别的语音信息进行拼接,获得语音组合结果,所述语音组合结果包括多个人物序号分别对应的语音组合信息;对所述语音组合结果进行声纹识别,确定所述语音组合结果对应的人物身份;将所述语音组合结果的文字提取结果与所述语音组合结果对应的人物身份进行绑定,获得语音识别结果。

    一种错误语料的生成方法及装置
    52.
    发明公开

    公开(公告)号:CN117313706A

    公开(公告)日:2023-12-29

    申请号:CN202311274183.1

    申请日:2023-09-28

    Abstract: 本申请公开了一种错误语料的生成方法及装置,该生成方法包括:获取参考文本;基于所述参考文本的分句结果满足的句式需求,确定所述参考文本的分句结果所属于的错误类型,所述错误类型包括特殊错误类型和普通错误类型;基于所述参考文本的分句结果所属于的错误类型及预设的错误类型处理规则,对所述参考文本的分句结果进行替换,直至所述错误类型的数量满足预设数量,完成错误语料的生成,所述预设的错误类型处理规则包括:错误类型的处理优先级及子错误类型的生成规则,能够提高错误语料的准确率,以及提高错误语料的全面性。

    手写体和印刷体文本分离方法及装置

    公开(公告)号:CN116912857A

    公开(公告)日:2023-10-20

    申请号:CN202310829177.1

    申请日:2023-07-07

    Abstract: 本申请提供一种手写体和印刷体文本分离方法及装置,用以解决手写体文本和印刷体文本相近的情况下文本框左右粘连,造成文本区域分离错误的技术问题。具体的,一种手写体和印刷体文本分离方案,通过使用卷积神经网络预测不同的字体类型特征图,根据不同的字体类型特征图对字体类型进行预测,提高了预测准确率和泛用性。通过在标签文本区域框两端,生成以标签文本区域框的高度为直径的高斯图,根据高斯图生成边界框,通过实际文本区域框中存在两个以上边界区域框,认定实际文本区域框要分离,进而确定手写体和印刷体文本框的边界,降低了由于不同文本区域框左右粘连导致文本区域框分离错误的概率,提高了手写体文本和印刷体文本分离的准确度。

    法律文书生成方法及装置
    54.
    发明公开

    公开(公告)号:CN116542233A

    公开(公告)日:2023-08-04

    申请号:CN202310588316.6

    申请日:2023-05-24

    Abstract: 本申请提供一种法律文书生成方法及装置,用以解决现有技术偏重于固定问题,导致法律文书与案件事实匹配性较低的技术问题。其中,一种法律文书生成方案,包括:获取历史案件事实描述文本;分析历史案件事实描述文本,建立包含案情属性、案情规则的案情图谱;基于案情规则,根据案情图谱中案情属性,生成引导文本;组合若干引导文本,得到问卷模型;输入当前案件事实描述文本至问卷模型,得到初步案件事实描述文本;输入初步案件事实描述文本至法律文书生成模型,得到对应案件事实的法律文书。基于案情图谱,生成多样化的问卷,提高了法律文书专业性。根据案情图谱中案情属性,生成引导文本,从而提高法律文书与案件事实的匹配性。

    基于应用中间件的防护方法及系统

    公开(公告)号:CN116132110A

    公开(公告)日:2023-05-16

    申请号:CN202211634274.7

    申请日:2022-12-19

    Abstract: 本申请公开了一种基于应用中间件的防护方法及系统,用以解决基于应用中间件的防护准确率较低的技术问题。其中,一种基于应用中间件的防护方案,采用应用中间件对Web应用程序的应用程序接口进行监控,对访问对象的访问请求进行防护检测,无须特意部署接口服务,降低了本方案的实施成本。并且,应用中间件的关注对象始终为恶意攻击的核心原理——执行代码中的动作属性,使得本方案的适用广泛。在面对最新出现的未知漏洞攻击,难以及时应对的技术问题时,也仅需补充相应的敏感动作属性,提高了应对速度。

    多媒体文件数据处理方法及装置
    57.
    发明公开

    公开(公告)号:CN116089750A

    公开(公告)日:2023-05-09

    申请号:CN202211601114.2

    申请日:2022-12-13

    Abstract: 本发明公开了一种多媒体文件数据处理方法及装置,用以解决音频校正文字的过程中,文字无法实现更精确地校正,准确性不高的技术问题。其中,该方法包括获取多媒体文件;根据多媒体文件,生成对应多媒体文件的字符集合;在多媒体文件的多媒体帧和作为字符集合的元素的字符之间,建立一一映射关系,以便校正对应多媒体帧对应的字符。基于业务需求,在音频校正文字的过程中,可以以更小的单元实时校正对应多媒体帧对应的字符,减小页面校正过程中的困难,提高校正过程中的准确率。

    OFD版式文档段落识别方法及装置

    公开(公告)号:CN114359943A

    公开(公告)日:2022-04-15

    申请号:CN202210038042.9

    申请日:2022-01-13

    Abstract: 本申请公开了一种OFD版式文档段落识别方法及装置,用以解决版式文档提取文字段落错误率高的技术问题。其中,一种OFD版式文档段落识别方案,通过对所述版式图像进行图像分割,至少生成若干文字块;提取所述若干文字块的特征属性;将相似版式进行聚类,生成元素为文字块的若干聚类文字块集合;对所述若干聚类文字块集合进行段落识别,生成段落块信息;根据所述段落块信息,更新版式文档中的段落标识。以便操作者在对文本段落进行提取时,可以得到还原流式格式的字符串。并且通过对文字块的语义连续性进行计算,提高了识别文本段落的准确性。同时,还针对OFD版式文档表格提出了一种新的文本提取方案,提高了文本提取的泛用性。

    远程运维方法及系统
    59.
    发明公开

    公开(公告)号:CN114338640A

    公开(公告)日:2022-04-12

    申请号:CN202111665991.1

    申请日:2021-12-31

    Abstract: 本申请公开了一种远程运维方法及系统,用以解决远程运维交互困难的技术问题。其中,一种远程运维系统包括:目标终端;用于发送维护数据包的远端处理终端;用于转发维护数据包至目标终端的运维设备。本申请所提供的远程运维系统,通过运维设备发送目标终端的屏幕画面至远端处理终端,并转发来自远端处理终端的、根据所述屏幕画面制作的维护指令包至目标终端,从而提高了远程运维的工作效率。通过改造连接目标终端的键盘,以实现维护指令包的有效输入。并且通过对非目标终端的屏幕画面设置掩码、对远端处理终端的操作权限进行验证、对维护指令包进行加密等技术手段以提高远程运维工作过程的安全性。

    语音识别文本的纠错方法
    60.
    发明授权

    公开(公告)号:CN113205813B

    公开(公告)日:2022-03-11

    申请号:CN202110357882.7

    申请日:2021-04-01

    Abstract: 本申请公开了一种语音识别文本的纠错方法。所述方法,包括:获取语音解码输出的待处理文本;调用检错模型处理所述待处理文本,得到出错目标字和出错目标字对应的置信度TopK候选字集;根据所述出错目标字和所述置信度TopK候选字集,对所述待处理文本进行纠错,得到第一纠错结果;根据名词处理模型和所述第一纠错结果,得到出错目标词、目标词类别和名词集合数据;根据所述出错目标词、所述目标词类别和所述名词集合数据,处理所述第一纠错结果,得到第二纠错结果;输出所述第二纠错结果,得到纠错后的最终文本;其中,K为正整数。通过用语言模型对语音解码输出的待处理文本进行处理,能够更好实现对语音识别文本的纠错。

Patent Agency Ranking