长文本分类方法、装置、设备及存储介质

    公开(公告)号:CN114281996A

    公开(公告)日:2022-04-05

    申请号:CN202111619122.5

    申请日:2021-12-27

    Abstract: 本申请实施例提供一种长文本分类方法、装置、设备及存储介质,该方法包括:将获取的目标长文本划分成N个序列后输入目标模型中,分别得到N个序列的文本表示,N为正整数;对N个序列的文本表示进行融合,得到目标长文本的篇章表示;根据目标长文本的篇章表示,得到目标长文本的分类结果。也就是说,本申请将目标长文本的N个序列的文本表示进行融合,得到整个目标长文本的篇章表示,基于整个目标长文本的篇章表示进行分类,即在分类过程中考虑了整个文本的语义信息和上下文信息,进而提高了目标长文本的分类准确性。

    一种裁判量刑偏离度预测方法及装置

    公开(公告)号:CN110287292B

    公开(公告)日:2021-10-01

    申请号:CN201910599594.5

    申请日:2019-07-04

    Abstract: 本申请公开了一种裁判量刑偏离度预测方法及装置,该方法包括:在获取到需要进行偏离度预测的目标卷宗材料后,根据各个目标案情要素与各个样本案情要素之间的关联关系,预测目标卷宗材料对应的判决结果的偏离度,其中,各个样本案情要素是从现有的大量已知判决结果的样本卷宗材料中提取的,且这些样本案情要素均是对其各自所属样本卷宗材料的判决结果有影响的关键性因素,因此,本申请将目标案情要素和与其有关联关系的样本案情要素共同作为参考依据,可以根据样本案情要素对样本卷宗材料的判决结果产生的影响,准确预测出目标案情要素对目标卷宗材料的判决结果可能产生的影响,进而能够更准确、更快速地预测出目标卷宗材料的判决结果的偏离度。

    一种文书生成方法、装置、存储介质和电子设备

    公开(公告)号:CN107622042A

    公开(公告)日:2018-01-23

    申请号:CN201710758045.9

    申请日:2017-08-29

    Inventor: 师玉娇 李宝善

    Abstract: 本发明公开了一种文书生成方法、装置、存储介质和电子设备,所述方法包括:对待生成文书的相关资料进行信息抽取,获取文书生成需要的内容信息;对所述内容信息进行知识表示;基于所述内容信息的知识表示,自动生成文书。通过本发明可解决现有技术只能采用人工方法来生成内容结构不固定文书所带来的耗时耗力、效率低下等问题。

    一种词权重类别的获得方法及装置

    公开(公告)号:CN106557465A

    公开(公告)日:2017-04-05

    申请号:CN201611033877.6

    申请日:2016-11-15

    Abstract: 本申请公开了一种词权重类别的获得方法及装置,方法包括:获得目标词;提取所述目标词的词特征,所述词特征包括词向量及互信息;利用预设的词集分类器根据所述词向量及互信息,对所述目标词进行分类,得到所述目标词的初始权重类别;其中,所述词集分类器是对历史语料集合通过语料词特征提取进行构建得到。本申请通过预先基于历史语料集合的语料词特征构建词集分类器,进而在对目标词进行分类时,首先提取目标词的词向量及互信息等词特征,进而再利用词集分类器根据这些词特征对目标词进行分类,进而得到目标词的初始权重类别,无需人工对目标词的权重类别的手动标注,节省大量的人力消耗,从而提高效率。

    水印添加方法、水印检测方法、水印处理装置及存储介质

    公开(公告)号:CN119885118A

    公开(公告)日:2025-04-25

    申请号:CN202411753584.X

    申请日:2024-12-02

    Abstract: 本申请提出一种水印添加方法、水印检测方法、水印处理装置以及计算机存储介质。所述水印添加方法包括:将用户交互内容与历史输出文字输入文本生成式大模型,获取原始文本概率分布;获取预设的概率转移矩阵;利用所述概率转移矩阵对所述原始文本概率分布进行修正,获取修正文本概率分布;将所述修正文本概率分布中的最大概率值对应的文字,作为添加水印后的当前输出文字。通过上述水印添加方法,避免使用哈希函数或者其他方式直接以单字设定红绿集合强硬划分破坏生成内容的准确性和可用性,利用概率转移矩阵对大模型的输出进行修正,以提高添加水印的准确性。

    答题内容批改方法、系统和相关装置

    公开(公告)号:CN119785366A

    公开(公告)日:2025-04-08

    申请号:CN202510278028.X

    申请日:2025-03-10

    Abstract: 本申请公开了一种答题内容批改方法、系统和相关装置,该方法包括:获取当前答卷对应的目标图像,利用图像识别大模型确定所述目标图像对应的至少一个目标分区;基于所述目标分区在所述目标图像中的位置信息,生成确定所述目标分区匹配的识别提示信息,将所述识别提示信息输入至所述识别大模型,利用所述提示信息生成得到所述目标图像匹配的识别结果;基于所述识别结果,生成获取与所述识别结果中的答题内容匹配的目标批改结果。通过上述方式,本申请能够提高对答题内容进行批改的效率和准确性。

    口语评测方法、装置及系统
    27.
    发明公开

    公开(公告)号:CN118053448A

    公开(公告)日:2024-05-17

    申请号:CN202410174889.9

    申请日:2024-02-07

    Abstract: 本发明提供一种口语评测方法、装置及系统,所述方法包括:确定待评测语音以及待评测语音对应的题目文本;对待评测语音进行语音识别,得到语音识别文本;基于题目文本对应的特征提取模型,提取语音识别文本的潜在评分特征;对语音识别文本的原始评分特征以及潜在评分特征进行融合,得到融合特征;将融合特征发送至服务端,以使服务端基于融合特征确定待评测语音的评测结果。本发明通过潜在评分特征对原始评分特征进行补充,避免传统方法中在人工制作答案无法覆盖所有正确答案情况下影响评测效果的问题。本发明减轻了服务端的运算压力,不仅可以提高服务端的评测响应速度,而且降低了服务端的硬件性能要求,节约了评测成本。

    一种朗读评测方法和装置、电子设备、存储介质

    公开(公告)号:CN117935863A

    公开(公告)日:2024-04-26

    申请号:CN202311708186.1

    申请日:2023-12-12

    Abstract: 本申请公开了一种朗读评测方法和装置、电子设备、存储介质,该方法包括获取待评测文本的发音序列和朗读音频;其中,朗读音频是用户对待评测文本进行朗读得到;对朗读音频进行句子划分,得到各目标句子的句子朗读音频;基于各目标句子在发音序列中的句子发音序列对句子朗读音频进行评测,得到各目标句子的句子评测结果;基于各句子评测结果,得到朗读音频的目标评测结果。通过上述方式,本申请能够自动对待评测文本的朗读音频进行评测,提高评测效率和准确度。

    特征提取方法、装置、电子设备和存储介质

    公开(公告)号:CN117789756A

    公开(公告)日:2024-03-29

    申请号:CN202311810523.8

    申请日:2023-12-25

    Abstract: 本发明提供一种特征提取方法、装置、电子设备和存储介质,其中方法包括:获取多帧流式数据的初始特征;逐帧对所述多帧流式数据的初始特征进行前向特征提取,得到多帧前向特征;对所述多帧流式数据的初始特征进行切分,得到多个分段帧,并对所述多个分段帧进行反向特征提取,得到多帧反向特征;将所述多帧前向特征和所述多帧反向特征进行拼接,并基于拼接后特征,确定所述多帧流式数据的目标特征。本发明提供的方法、装置、电子设备和存储介质,可以更加准确、高效地进行特征提取,提高特征的表达能力和鲁棒性。

    文本润色、模型训练方法和一体机

    公开(公告)号:CN117764035A

    公开(公告)日:2024-03-26

    申请号:CN202311748670.7

    申请日:2023-12-18

    Abstract: 本发明提供一种文本润色、模型训练方法和一体机,其中文本润色方法包括:接收用户输入的原始文本;基于所述原始文本生成提示语文本;将所述提示语文本输入用于文本润色的大型语言模型,得到所述大型语言模型输出的与所述原始文本对应的润色文本;展示所述润色文本。本发明提供的方法和一体机,基于原始文本生成提示语文本,并将提示语文本输入到大型语言模型以实现针对原始文本的文本润色,大型语言模型强大的上下文语义理解能力能够提升文本润色的效果,并且基于原始文本生成提示语文本并输入大型语言模型,实现了端到端的文本润色,用户仅需提供原始文本即可获取润色文本,减轻了用户的操作负担,降低了用户的操作门槛。

Patent Agency Ranking