-
公开(公告)号:CN116361469B
公开(公告)日:2024-07-19
申请号:CN202310347857.X
申请日:2023-04-03
Applicant: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司
IPC: G06F16/35
Abstract: 本发明提供了一种基于预训练模型的话题生成方法,包括:获取待聚类文本中的每个文本的特征向量和关键词,每个文本包括h个关键词;利用设定聚类算法对待聚类文本进行聚类,得到多个话题;对多个话题进行清洗和合并处理,得到处理后的n个话题;对于n个话题中的任一话题,基于预训练生成模型生成对应的话题描述;输出n个话题的话题描述和对应的文本。本发明由于采用预训练生成模型生成话题描述,使得得到的话题描述通顺,可读性强,并且由于对话题进行了清洗和合并,使得聚类结果更加准确。
-
公开(公告)号:CN113269125B
公开(公告)日:2024-05-14
申请号:CN202110646314.9
申请日:2021-06-10
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06V40/16 , G06V10/74 , G06F16/583
Abstract: 本发明实施例公开了一种人脸识别方法、装置、设备及存储介质。该方法包括:获取人脸识别图库,以及与待识别视频对应的视频人脸集合,人脸识别图库中包括至少一个人脸图像集合,人脸图像集合中各人脸图像具有相同身份标识号;根据视频人脸集合、人脸识别图库和预设识别条件,在视频人脸集合中确定至少一个候选视频人脸图像,并确定与各候选视频人脸图像对应的候选人脸图像集合;根据各候选人脸图像集合对应的身份标识号,在各候选视频人脸图像中确定目标视频人脸图像。本发明实施例的技术方案,解决了当人脸识别图库中具有多个相似人脸图像时,仅进行一次筛选在待识别视频中确定出的人脸图像识别结果准确性差的问题,提高了人脸图像识别的准确性。
-
公开(公告)号:CN115797715B
公开(公告)日:2023-06-23
申请号:CN202211583636.4
申请日:2022-12-09
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06V10/77 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明提供了一种量子视觉MLP处理系统及存储介质,所述系统包括n个量子视觉MLP处理模块、处理器和存储有一段计算机程序的存储器,所述量子视觉处理模块包括n个依次连接的量子视觉MLP处理单元,当所述处理器执行一段计算机程序时,实现如下步骤:获取目标图像对应的图像块初始特征向量,将图像块初始化特征向量输入量子视觉MLP处理模块,以获得该目标图像的最终图像聚合特征和最终图像块特征;本发明提出的量子视觉MLP处理系统,一方面使得图像块的特征充分考虑了其语义内容,更利于图像块的聚合,另一方面,其包含了较少的归纳偏差,具有较高的适应性。
-
公开(公告)号:CN116049413B
公开(公告)日:2023-06-13
申请号:CN202310346366.3
申请日:2023-04-03
Applicant: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司
IPC: G06F16/35 , G06F18/22 , G06F18/2415 , G06N3/0455 , G06N3/047
Abstract: 本发明提供了一种基于事件演化的用户观点和立场获取方法,首先对输入的多个文本例如新闻进行文本聚类,然后对聚类结果进行清洗和合并以得到事件,然后针对事件的演化过程,抽取事件对应的评论者、观点和立场,最后按照事件的演化时间顺序,输出对应的评论者、观点和立场,能够根据事件的演变,推断评论者的观点、立场的变化情况。
-
公开(公告)号:CN115797715A
公开(公告)日:2023-03-14
申请号:CN202211583636.4
申请日:2022-12-09
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06V10/77 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明提供了一种量子视觉MLP处理系统及存储介质,所述系统包括n个量子视觉MLP处理模块、处理器和存储有一段计算机程序的存储器,所述量子视觉处理模块包括n个依次连接的量子视觉MLP处理单元,当所述处理器执行一段计算机程序时,实现如下步骤:获取目标图像对应的图像块初始特征向量,将图像块初始化特征向量输入量子视觉MLP处理模块,以获得该目标图像的最终图像聚合特征和最终图像块特征;本发明提出的量子视觉MLP处理系统,一方面使得图像块的特征充分考虑了其语义内容,更利于图像块的聚合,另一方面,其包含了较少的归纳偏差,具有较高的适应性。
-
公开(公告)号:CN114492420B
公开(公告)日:2022-07-29
申请号:CN202210340732.X
申请日:2022-04-02
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/284 , G06F40/289 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本公开涉及一种文本分类方法、装置、设备及计算机可读存储介质,该方法包括:对待分类的文本进行分词处理,得到文本中包含的词汇;从预设的语义库中查找词汇对应的语义,以及语义在语义库中的位置,得到语义的位置向量;响应于词汇对应的语义有多个,基于词汇在所述文本中的上下文,确定词汇对应的每个语义的权重;基于词汇对应的每个语义的权重,对词汇对应的多个语义的位置向量进行加权叠加处理,得到词汇的特征向量;基于文本中包含的词汇的特征向量,确定文本的特征向量;基于文本的特征向量对文本进行分类。通过上述技术方案,将文本转化到量子领域进行处理,减少计算成本的同时,提升了文本的分类准确率,提升用户的使用体验。
-
公开(公告)号:CN114281944A
公开(公告)日:2022-04-05
申请号:CN202111619353.6
申请日:2021-12-27
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/33 , G06F40/289 , G06F16/242 , G06N3/08
Abstract: 本申请实施例提供一种文档匹配模型的构建方法、装置、电子设备及存储介质,其中,该方法包括:步骤一,获取查询词汇特征集合和文档特征集合;步骤二,获得查询词汇特征集合和文档特征集合的相关性特征值;步骤三,获得文档特征集合中每个文档特征与查询词汇特征集合的第一匹配值,选取第一匹配值最大的文档特征;步骤四,获得第二文档特征;步骤五,将候选文档特征集合作为新的候选文档特征集合,将第二文档特征作为新的第一文档特征,重复步骤四;步骤六,根据有序文档特征集合和文档特征集合获得损失函数,并根据损失函数构建匹配模型。实施本申请实施例,使得匹配模型可以引入认知层面的相关性特征,提高了匹配模型的准确率和检索性能。
-
公开(公告)号:CN116361468B
公开(公告)日:2024-05-03
申请号:CN202310347374.X
申请日:2023-04-03
Applicant: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司
IPC: G06F16/35
Abstract: 本发明提供了一种事件脉络生成方法、电子设备和存储介质,方法包括:首先对接收到的文本进行文本编码,然后进行文本聚类,并进行话题清洗与合并,得到所有话题,然后对每个话题,进行事件拆分,得到每个事件,并对相似事件进行合并,然后基于文本相似度进行事件脉络生成,能够更好地划分话题或事件,使得生成的话题或事件更加准确。此外,本发明不需要人工干预,可自动对多篇新闻进行数据预处理,生成话题库和事件库,并根据发布时间,输出事件的事件脉络。
-
公开(公告)号:CN116361468A
公开(公告)日:2023-06-30
申请号:CN202310347374.X
申请日:2023-04-03
Applicant: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司
IPC: G06F16/35
Abstract: 本发明提供了一种事件脉络生成方法、电子设备和存储介质,方法包括:首先对接收到的文本进行文本编码,然后进行文本聚类,并进行话题清洗与合并,得到所有话题,然后对每个话题,进行事件拆分,得到每个事件,并对相似事件进行合并,然后基于文本相似度进行事件脉络生成,能够更好地划分话题或事件,使得生成的话题或事件更加准确。此外,本发明不需要人工干预,可自动对多篇新闻进行数据预处理,生成话题库和事件库,并根据发布时间,输出事件的事件脉络。
-
公开(公告)号:CN115982395A
公开(公告)日:2023-04-18
申请号:CN202310267414.X
申请日:2023-03-20
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/45 , G06F18/2415 , G06F18/25 , G06F18/2135
Abstract: 本发明涉及多模态情感预测领域,特别是涉及一种基于量子的媒体信息的情感预测方法、介质及设备。包括如下步骤:对每一模态的表示信息进行预处理,生成每一模态的表示信息对应的复数词向量集A1及A2,对A1及A2进行特征转换处理,生成对应的特征密度矩阵集ρt及ρv;对ρt及ρv进行特征融合处理,生成融合特征fp;根据fp与多个预设情感类型的投影算子,生成fp为每一种预设情感类型的概率值。将P(e1),P(e2),…,P(ew)中最大值对应的情感类型,作为目标媒体信息的情感类型。通过利用量子理论的模型,可以更加有效的捕获不同模态之间的信息交互,进而可以提高对媒体信息所表达情绪的预测结果的精度。
-
-
-
-
-
-
-
-
-