一种文本原创识别方法、装置、电子设备及存储介质

    公开(公告)号:CN113553839B

    公开(公告)日:2024-05-10

    申请号:CN202010340711.9

    申请日:2020-04-26

    Abstract: 本申请涉及一种文本原创识别方法、装置、电子设备及存储介质,该方法包括:获取待识别的第一文本数据,以及与所述第一文本数据相关联的第二文本数据;确定所述第一文本数据的来源信息;当所述来源信息不满足于预设条件时,对所述第一文本数据和所述第二文本数据进行比较,得到相似度特征指标;将所述相似度特征指标输入训练好的识别模型,由所述识别模型根据所述相似度特征指标进行计算得到所述文本数据的原创识别结果。该技术方案一方面通过基于来源信息对文本进行初步原创判断,另一方面采用相似度指标对文本进行原创识别,以此种方式提高了原创识别的准确性和有效性,本申请采用的方法能够更好的服务于新闻工作的需求。

    评论生成模型训练方法和装置、信息生成方法和装置

    公开(公告)号:CN117591948A

    公开(公告)日:2024-02-23

    申请号:CN202410082714.5

    申请日:2024-01-19

    Abstract: 本公开提供了一种评论生成模型训练方法和装置,涉及人工智能技术领域,具体涉及自然语言处理、深度学习、大模型等技术领域。具体实现方案为:获取文本样本集,文本样本集包括:第一文本样本,第一文本样本包括:展示文本以及与展示文本相关的情感立场文本;获取预先构建的评论生成网络,评论生成网络包括:编码器和解码器,编码器分别对展示文本和情感立场文本进行建模,得到评论全局特征向量;解码器用于对评论全局特征向量进行解码,得到评论结果信息;将从文本样本集中选取的第一文本样本输入评论生成网络,得到评论生成网络输出的评论结果信息;基于评论结果信息,得到训练完成的评论生成模型。

    面向大语言模型的词向量生成方法、电子设备及存储介质

    公开(公告)号:CN117113990B

    公开(公告)日:2024-01-12

    申请号:CN202311374453.6

    申请日:2023-10-23

    Abstract: 本发明涉及计算机技术应用领域,提供了一种面向大语言模型的词向量生成方法、电子设备及存储介质,包括:获取待分词的文本,作为目标文本;对目标文本进行分词处理,得到对应的分词集S;基于预设词向量基准表T,获取每个词在每个嵌入矩阵的特征向量;基于预设滑动窗口长度d,将S划分为多个语句片段,得到对应的语句片段集SP;对每个语句片段的特征向量进行融合,得到对应的特征向量;得到SP对应的特征向量F作为目标文本的特征向量。本发明在词向量生成过程中,将多个相邻的词组合视为一个词,能够使得分词的长度得到极大的压缩。此外,将不同词的特征向量通过张量积的方式组合成一个词的特征向量,可以极大的降低可训练参数量。

    知识融合方法、装置、设备、系统及介质

    公开(公告)号:CN114139547B

    公开(公告)日:2023-07-04

    申请号:CN202111416144.1

    申请日:2021-11-25

    Abstract: 本公开涉及一种知识融合方法、装置、设备、系统及介质。其中,知识融合法包括:基于第一实体数据中的第一实体名,获取第一实体数据对应的实体的至少一个实体别称,得到实体名称集;基于实体名称集,检测第一实体名和第二实体数据中的第二实体名是否匹配;在检测到第一实体名和第二实体名匹配时,将第一实体数据和第二实体数据进行融合,得到融合实体数据。根据本公开实施例,能够根据两条实体数据中的实体名是否匹配来判断它们是否需要融合,以减少计算量,提高融合效率,并且在两条实体数据中的实体名不匹配时,能够根据该两条实体数据的多维度相似度进行融合判别,以提高判别精度,进而实现多来源知识的融合,达到精准有效融合效果。

    一种基于量子的媒体信息的情感预测方法、介质及设备

    公开(公告)号:CN115982395B

    公开(公告)日:2023-05-23

    申请号:CN202310267414.X

    申请日:2023-03-20

    Abstract: 本发明涉及多模态情感预测领域,特别是涉及一种基于量子的媒体信息的情感预测方法、介质及设备。包括如下步骤:对每一模态的表示信息进行预处理,生成每一模态的表示信息对应的复数词向量集A1及A2,对A1及A2进行特征转换处理,生成对应的特征密度矩阵集ρt及ρv;对ρt及ρv进行特征融合处理,生成融合特征fp;根据fp与多个预设情感类型的投影算子,生成fp为每一种预设情感类型的概率值。将P(e1),P(e2),…,P(ew)中最大值对应的情感类型,作为目标媒体信息的情感类型。通过利用量子理论的模型,可以更加有效的捕获不同模态之间的信息交互,进而可以提高对媒体信息所表达情绪的预测结果的精度。

    知识图谱本体构建方法、装置、设备及可读存储介质

    公开(公告)号:CN114528417B

    公开(公告)日:2022-07-29

    申请号:CN202210377444.1

    申请日:2022-04-12

    Abstract: 本公开涉及一种知识图谱本体构建方法、装置、设备及可读存储介质。本公开通过基于文本语料获取文本领域本体候选集,并基于图像数据获取图像领域本体候选集,基于文本领域本体候选集中文本领域本体的本体概念词,确定文本领域本体的层次结构,基于图像领域本体候选集中图像领域本体的图像语义标签,确定图像领域本体的层次结构。进而基于文本领域本体候选集、文本领域本体的层次结构、图像领域本体候选集和图像领域本体的层次结构,确定包含文本领域本体和图像领域本体的知识图谱本体,实现了对文本和图像等多模态数据的知识本体分类别、分层次的构建。

    变票实体检测方法及系统
    69.
    发明公开

    公开(公告)号:CN113869383A

    公开(公告)日:2021-12-31

    申请号:CN202111091011.1

    申请日:2021-09-17

    Abstract: 本公开涉及一种变票实体检测方法及系统。该方法包括:获取多个实体的特征数据,实体包括待检测实体和待检测实体的关联实体,特征数据包括开票特征和属性特征,将特征数据输入至预先训练好的检测模型,得到预先训练好的检测模型输出的待检测实体的变票预测评分,若变票预测评分符合预设的变票实体检测条件,则确定待检测实体属于变票实体。通过上述技术方案,能够利用训练好的检测模型并结合待检测实体和关联实体的特征数据进行较高准确性和鲁棒性的实体预测,可以提高变票实体的预测准确性,以进一步满足税务稽查和征管等涉税业务的实际业务需求。

Patent Agency Ranking