-
公开(公告)号:CN115982395A
公开(公告)日:2023-04-18
申请号:CN202310267414.X
申请日:2023-03-20
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/45 , G06F18/2415 , G06F18/25 , G06F18/2135
Abstract: 本发明涉及多模态情感预测领域,特别是涉及一种基于量子的媒体信息的情感预测方法、介质及设备。包括如下步骤:对每一模态的表示信息进行预处理,生成每一模态的表示信息对应的复数词向量集A1及A2,对A1及A2进行特征转换处理,生成对应的特征密度矩阵集ρt及ρv;对ρt及ρv进行特征融合处理,生成融合特征fp;根据fp与多个预设情感类型的投影算子,生成fp为每一种预设情感类型的概率值。将P(e1),P(e2),…,P(ew)中最大值对应的情感类型,作为目标媒体信息的情感类型。通过利用量子理论的模型,可以更加有效的捕获不同模态之间的信息交互,进而可以提高对媒体信息所表达情绪的预测结果的精度。
-
公开(公告)号:CN115934752A
公开(公告)日:2023-04-07
申请号:CN202211585614.1
申请日:2022-12-09
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本发明提供了一种构建检索模型的方法、电子设备和存储介质,包括:获取目标文本的目标文本词向量,获取目标文本对应的候选代表词集合和候选随机词集合,将目标文本词集合与候选代表词集合和候选随机词集合分别进行拼接,输入到量子概率注意力值模型,获取对应的注意力值,将注意力值分别输入多层感知机,获取候选代表词为代表词的概率和候选随机词为代表词的概率,基于候选代表词为代表词的概率和候选随机词为代表词的概率,最小化两者的损失函数,获取目标检索模型;从而取得更好的检索效果。
-
公开(公告)号:CN115713427A
公开(公告)日:2023-02-24
申请号:CN202211408253.3
申请日:2022-11-10
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06Q40/12
Abstract: 本公开涉及一种新迁入企业税前税源管理方法、装置、设备及存储介质。本公开实施例,通过获取新迁入企业的第一经营纳税数据以及与新迁入企业存在关联关系的其他企业的第二经营纳税数据;对第一经营纳税数据进行特征提取处理,得到新迁入企业的纳税异常特征向量;确定各关联关系对应的新迁入企业所属的企业社区以及社区特征向量;基于纳税异常特征向量和社区特征向量得到新迁入企业对应的税前监控特征向量;将税前监控特征向量输入预设的新迁入企业税前监控模型,基于企业税前监控模型对新迁入企业进行税前监控,可以在海量新迁入企业的税前税源管理中对异常新迁入企业进行精准稳定地的识别与预警,提高对异常税源预警响应的时效性和准确性。
-
公开(公告)号:CN115271892A
公开(公告)日:2022-11-01
申请号:CN202210547647.0
申请日:2022-05-18
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06Q40/00 , G06F16/2458 , G06F16/2457 , G06N3/04 , G06N3/08 , G06Q50/26
Abstract: 本公开实施例提供了一种骗取留抵退税识别模型的构建方法、装置、设备和存储介质。骗取留抵退税识别模型构建方法包括获取多个样本退税申请数据序列和对应的实体标签;基于样本退税申请数据序列确定对应的第一特征向量;基于多个第一特征向量和对应的实体标签对预先构建的骗取留抵退税识别模型进行训练。骗取留抵退税识别模型构建方法能够直接挖掘样本退税申请数据的特征构建骗取留抵退税识别模型,而无需如现有专家评价指标体系的方法需要依靠专家经验设定评价指标、指标权重和指标阈值的问题。
-
公开(公告)号:CN114281944B
公开(公告)日:2022-08-23
申请号:CN202111619353.6
申请日:2021-12-27
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/33 , G06F40/289 , G06F16/242 , G06N3/08
Abstract: 本申请实施例提供一种文档匹配模型的构建方法、装置、电子设备及存储介质,其中,该方法包括:步骤一,获取查询词汇特征集合和文档特征集合;步骤二,获得查询词汇特征集合和文档特征集合的相关性特征值;步骤三,获得文档特征集合中每个文档特征与查询词汇特征集合的第一匹配值,选取第一匹配值最大的文档特征;步骤四,获得第二文档特征;步骤五,将候选文档特征集合作为新的候选文档特征集合,将第二文档特征作为新的第一文档特征,重复步骤四;步骤六,根据有序文档特征集合和文档特征集合获得损失函数,并根据损失函数构建匹配模型。实施本申请实施例,使得匹配模型可以引入认知层面的相关性特征,提高了匹配模型的准确率和检索性能。
-
公开(公告)号:CN114528417A
公开(公告)日:2022-05-24
申请号:CN202210377444.1
申请日:2022-04-12
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/36 , G06F40/295 , G06F40/30
Abstract: 本公开涉及一种知识图谱本体构建方法、装置、设备及可读存储介质。本公开通过基于文本语料获取文本领域本体候选集,并基于图像数据获取图像领域本体候选集,基于文本领域本体候选集中文本领域本体的本体概念词,确定文本领域本体的层次结构,基于图像领域本体候选集中图像领域本体的图像语义标签,确定图像领域本体的层次结构。进而基于文本领域本体候选集、文本领域本体的层次结构、图像领域本体候选集和图像领域本体的层次结构,确定包含文本领域本体和图像领域本体的知识图谱本体,实现了对文本和图像等多模态数据的知识本体分类别、分层次的构建。
-
公开(公告)号:CN114492420A
公开(公告)日:2022-05-13
申请号:CN202210340732.X
申请日:2022-04-02
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/284 , G06F40/289 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本公开涉及一种文本分类方法、装置、设备及计算机可读存储介质,该方法包括:对待分类的文本进行分词处理,得到文本中包含的词汇;从预设的语义库中查找词汇对应的语义,以及语义在语义库中的位置,得到语义的位置向量;响应于词汇对应的语义有多个,基于词汇在所述文本中的上下文,确定词汇对应的每个语义的权重;基于词汇对应的每个语义的权重,对词汇对应的多个语义的位置向量进行加权叠加处理,得到词汇的特征向量;基于文本中包含的词汇的特征向量,确定文本的特征向量;基于文本的特征向量对文本进行分类。通过上述技术方案,将文本转化到量子领域进行处理,减少计算成本的同时,提升了文本的分类准确率,提升用户的使用体验。
-
公开(公告)号:CN113672731A
公开(公告)日:2021-11-19
申请号:CN202110881327.4
申请日:2021-08-02
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本公开实施例涉及一种基于领域信息的情感分析方法,该方法包括:对待分析的文本信息进行预处理,并获取领域信息;将待分析的文本信息输入到预先融合有领域信息的情感分类模型中,获取文本信息的情感类别;融合有领域信息的情感分类模型包括:全局情感语义模型、每一个领域的局部情感语义模型和对应每一个领域的情感融合策略;其中,基于与领域信息匹配的局部情感语义模型,获取局部情感概率值;基于全局情感语义模型,获取全局情感概率值;基于与领域信息匹配的情感融合策略,对局部情感概率值和全局情感概率值进行融合,获得融合结果;基于融合结果获取情感类别。通过本方法进行文本情感分析,分类效果更好,大大提高了分析结果的准确率。
-
公开(公告)号:CN113536802A
公开(公告)日:2021-10-22
申请号:CN202010319243.7
申请日:2020-04-21
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本申请涉及一种小语种文本数据的情感判别方法、装置、设备和存储介质。所述方法包括:获取文本数据;提取文本数据的多个文本特征;将文本特征输入支持向量机模型,得到文本数据的第一评价特征;将文本数据输入mBERT模型,得到文本数据的第二评价特征;输入第一评价特征和第二评价特征至情感判别器,输出文本数据的情感判别结果。支持向量机模型所采用的语言本身的特征进行判别时,可以提高对不同语言的情感判别准确度,采用mBERT学习不同语言深度语义向量进行的不同语言情感判别,可以很好的提升模型判别的泛化能力。
-
公开(公告)号:CN113536763A
公开(公告)日:2021-10-22
申请号:CN202110821206.0
申请日:2021-07-20
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/194 , G06F16/335
Abstract: 本公开涉及一种信息处理方法、装置、设备及存储介质。其中,信息处理方法包括:获取待处理文本;确定待处理文本与已存储文本之间的文本相似度;基于待处理文本的发布时间和已存储文本的发布时间,对文本相似度进行修正,得到修正后的文本相似度;在修正后的文本相似度大于或等于预设相似度阈值的情况下,将已存储文本作为待处理文本的相似文本。根据本公开实施例,可以提高重复信息的查找精度和效率且节约设备资源,以进一步提高重复信息的处理效果和效率,降低文本内容的重复性,进而使得用户快速且准确的从网络平台中查找感兴趣信息的需求,提高用户查看信息的体验且节约设备资源。
-
-
-
-
-
-
-
-
-