文本对齐方法、装置、电子设备和存储介质

    公开(公告)号:CN118035379A

    公开(公告)日:2024-05-14

    申请号:CN202410033759.3

    申请日:2024-01-09

    Abstract: 本发明提供一种文本对齐方法、装置、电子设备和存储介质,该方法包括:获取文本对,文本对包括第一文本和第二文本;对第一文本和第二文本分别进行分句,得到第一文本的第一句集和第二文本的第二句集,并将第一句集与所述第二句集进行句级配对,得到第一句集中各第一句子在第二句集中的配对句;基于各第一句子,以及各第一句子的配对句,对文本对进行文本对齐。本发明提供的方法、装置,通过预先对输入文本对进行句子级别的切分和对齐,然后实现句内的语义单元文本对齐,对齐效果更优,错误范围更小,实现了跨句对齐、句子乱序对齐的句级对齐,大大提升了进行文本对齐的准确性,进而提升了文本对齐在各自然语言处理领域的应用效果。

    语音质量检测方法和相关方法、装置、设备和存储介质

    公开(公告)号:CN117912450A

    公开(公告)日:2024-04-19

    申请号:CN202410034643.1

    申请日:2024-01-09

    Abstract: 本申请公开了一种语音质量检测方法和相关方法、装置、设备和存储介质。该方法包括:提取目标语音的声学特征;基于声学特征进行识别,得到目标语音中各音频帧的音素概率和目标语音的识别文本;基于参考词典,获取识别文本中各个字符的音素发音,并基于识别文本中各个字符的音素发音,得到若干候选发音路径;其中,若干候选发音路径上各音素形成候选音素序列;基于音频帧的音素概率和若干候选发音路径,得到目标语音关于至少一种发音质量指标的检测值。上述方案,能够提高对目标语音发音质量检测的准确度。

    法律咨询方法、装置、一体机和存储介质

    公开(公告)号:CN117453874A

    公开(公告)日:2024-01-26

    申请号:CN202311385404.2

    申请日:2023-10-23

    Abstract: 本发明提供一种法律咨询方法、装置、一体机和存储介质,其中方法包括:获取待咨询的法律问题;基于法律问题,确定解题法条信息,解题法条信息中包括解答法律问题所需的法典,以及法典对应的法条;基于法律问题和所述解题法条信息,生成法律问题的问题答案,实现了快速准确的法律咨询,克服了传统方案中法律咨询耗时费力,且答案准确性不高,成本高昂,以及无法及时得到有效的反馈的问题,不仅提升了咨询效率,可以及时得到有效的回复,需求得以被满足,还保证了问题答案的准确性和可靠性,同时极大地降低了咨询成本,优化法律服务的质量和效率,并为法律知识的普及和发展提供了助力。

    基于知识蒸馏的语言模型训练方法、文本分类方法及装置

    公开(公告)号:CN112733550B

    公开(公告)日:2023-07-25

    申请号:CN202011627649.8

    申请日:2020-12-31

    Abstract: 本申请公开了基于知识蒸馏的语言模型训练方法、文本分类方法及装置。该语言模型训练方法包括:将训练语料输入到第一模型与第二模型中进行处理,以获取对应的中间层数据以及输出结果;利用对应的中间层数据计算得到第一隐层句子内容以及第二隐层句子内容,并基于第一隐层句子内容与第二隐层句子内容构造对比学习正负例,利用对比学习正负例、对应的中间层数据以及输出结果对第二模型进行训练,并将训练完成后的第二模型确定为语言模型。通过上述分类模型,本申请能够将第一模型丰富的句子语法以及语义表征迁移到第二模型中,使蒸馏获得的第二模型具有更好的迁移能力,从而满足跨领域的应用需求。

    一种对象评估方法及装置
    45.
    发明授权

    公开(公告)号:CN108038627B

    公开(公告)日:2022-06-07

    申请号:CN201711445002.1

    申请日:2017-12-27

    Inventor: 李宝善 赵昂

    Abstract: 本申请提供了一种对象评估方法及装置,对象评估方法包括:获取与待评估对象及待评估项目关联的信息数据;参考预置的评估属性模板,从信息数据中确定评估属性数据;将评估属性数据输入至预先建立的项目评估模型,得到项目评估模型输出的待评估对象在待评估项目中的评估结果,项目评估模型为预先利用标注有评估结果的评估属性训练数据进行训练得到。在本申请中,通过以上方式可以节省人力和时间,进而可以降低成本,提高评估效率。

    类案推荐方法及相关装置
    46.
    发明公开

    公开(公告)号:CN114398474A

    公开(公告)日:2022-04-26

    申请号:CN202111592766.X

    申请日:2021-12-23

    Abstract: 本申请公开了一种类案推荐方法及相关装置,所述类案推荐方法包括:获得用户输入的案件文本,并对所述案件文本进行模块抽取以获得所述案件文本所包含的所有模块以及每个所述模块的模块内容;基于所述案件文本的所有所述模块的模块内容确定所述模块之间的关联关系,以构建结构化后的所述案件文本;获得结构化后的所述案件文本中各个模块的向量化表示,并基于所述向量化表示从案例数据库中获得与所述案件文本相似的历史案例。通过上述方式,本申请能够将用户输入的案件文本解析形成统一的结构化表示形式,以获得更好的推荐结果。

    一种图谱构建方法及其相关设备

    公开(公告)号:CN114254121A

    公开(公告)日:2022-03-29

    申请号:CN202111481742.7

    申请日:2021-12-06

    Abstract: 本申请公开了一种图谱构建方法及其相关设备,该方法包括:在获取到包括至少一组因果事件的待使用文本之后,先从该待使用文本抽取至少一个待使用原因事件;再根据各待使用原因事件和该待使用文本,确定各待使用原因事件对应的结果事件;最后,根据至少一个待使用原因事件和该至少一个待使用原因事件对应的结果事件,确定因果事件图谱,以使该因果事件图谱用于记录该待使用文本中所存在的因果关系,如此能够实现自动构建因果事件图谱的目的,从而能够降低因果事件图谱的构建成本。

    基于知识蒸馏的语言模型训练方法、文本分类方法及装置

    公开(公告)号:CN112733550A

    公开(公告)日:2021-04-30

    申请号:CN202011627649.8

    申请日:2020-12-31

    Abstract: 本申请公开了基于知识蒸馏的语言模型训练方法、文本分类方法及装置。该语言模型训练方法包括:将训练语料输入到第一模型与第二模型中进行处理,以获取对应的中间层数据以及输出结果;利用对应的中间层数据计算得到第一隐层句子内容以及第二隐层句子内容,并基于第一隐层句子内容与第二隐层句子内容构造对比学习正负例,利用对比学习正负例、对应的中间层数据以及输出结果对第二模型进行训练,并将训练完成后的第二模型确定为语言模型。通过上述分类模型,本申请能够将第一模型丰富的句子语法以及语义表征迁移到第二模型中,使蒸馏获得的第二模型具有更好的迁移能力,从而满足跨领域的应用需求。

    证据链构建方法、电子设备和存储介质

    公开(公告)号:CN112348714A

    公开(公告)日:2021-02-09

    申请号:CN202011224496.2

    申请日:2020-11-05

    Abstract: 本发明实施例提供一种证据链构建方法、电子设备和存储介质,该方法包括:确定待审查卷宗中各个文书;对各个文书进行案件内容提取和识别,得到各个文书的案件内容及其审查要素标签;基于各个文书的案件内容的审查要素标签,对各个文书的案件内容进行整合,得到各个审查要素标签下的整合内容;其中,所述各个审查要素标签基于阅卷思路拆分得到;基于各个审查要素标签下的整合内容,构建所述待审查卷宗的证据链。本发明实施例提供的方法、电子设备和存储介质,基于阅卷思路得到的审查要素标签的应用,使得构建的证据链更加准确全面,更能够贴合相关人员的思维模式。

Patent Agency Ranking