-
公开(公告)号:CN112613324B
公开(公告)日:2024-11-12
申请号:CN202011596697.5
申请日:2020-12-29
Applicant: 北京中科闻歌科技股份有限公司 , 深圳中科闻歌科技有限公司 , 国科智安(北京)科技有限公司
Abstract: 本申请涉及一种语义情绪识别方法、装置、设备及存储介质,所述方法包括:获取待识别文本,然后对待识别文本的全局语义信息进行提取,得到第一语义向量,再利用预训练的词向量模型确定待识别文本的词向量矩阵,之后根据词向量矩阵确定第二语义向量,根据词向量矩阵计算待识别文本中每个词的词向量与预设情绪词语的词向量的相似度,并将计算得到的所有相似度确定为第三语义向量,最后根据第一语义向量、第二语义向量和第三语义向量确定待识别文本所属的情绪类别,如此,便可以根据待识别文本的全局语义信息以及待识别文本的词向量矩阵确定待识别文本的情绪类别,考虑了待识别文本的词语义、词组语义以及句子语义信息,提高了情绪识别的准确性。
-
公开(公告)号:CN112329470B
公开(公告)日:2024-05-28
申请号:CN202011241374.4
申请日:2020-11-09
Applicant: 北京中科闻歌科技股份有限公司 , 深圳中科闻歌科技有限公司 , 国科智安(北京)科技有限公司
IPC: G06F40/295 , G06F40/226 , G06N3/08
Abstract: 本申请提供了一种基于端到端模型训练的智能地址识别方法及装置,属于计算机技术领域。本申请通过获取训练数据集,所述训练数据集包括多个地址文本数据及每个所述地址文本数据对应的验证数据;针对每个地址文本数据,生成所述地址文本数据对应的字符嵌入向量序列;将所述字符嵌入向量序列输入至第一级子模型;将每一级子模型的输出数据与所述验证数据比较,得到多个误差;根据所述多个误差调整所述地址文本识别模型的参数,直至所述地址文本识别模型收敛时,训练结束。通过本申请,可以将多个级联的子模型产生的多个误差,作为依据以调整地址文本识别模型的参数,减少多个级联子模型的整体误差,避免了多个子模型之间的误差累积。
-
公开(公告)号:CN117113990B
公开(公告)日:2024-01-12
申请号:CN202311374453.6
申请日:2023-10-23
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/284 , G06F40/289 , G06F18/25
Abstract: 本发明涉及计算机技术应用领域,提供了一种面向大语言模型的词向量生成方法、电子设备及存储介质,包括:获取待分词的文本,作为目标文本;对目标文本进行分词处理,得到对应的分词集S;基于预设词向量基准表T,获取每个词在每个嵌入矩阵的特征向量;基于预设滑动窗口长度d,将S划分为多个语句片段,得到对应的语句片段集SP;对每个语句片段的特征向量进行融合,得到对应的特征向量;得到SP对应的特征向量F作为目标文本的特征向量。本发明在词向量生成过程中,将多个相邻的词组合视为一个词,能够使得分词的长度得到极大的压缩。此外,将不同词的特征向量通过张量积的方式组合成一个词的特征向量,可以极大的降低可训练参数量。
-
公开(公告)号:CN115982395B
公开(公告)日:2023-05-23
申请号:CN202310267414.X
申请日:2023-03-20
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/45 , G06F18/2415 , G06F18/25 , G06F18/2135
Abstract: 本发明涉及多模态情感预测领域,特别是涉及一种基于量子的媒体信息的情感预测方法、介质及设备。包括如下步骤:对每一模态的表示信息进行预处理,生成每一模态的表示信息对应的复数词向量集A1及A2,对A1及A2进行特征转换处理,生成对应的特征密度矩阵集ρt及ρv;对ρt及ρv进行特征融合处理,生成融合特征fp;根据fp与多个预设情感类型的投影算子,生成fp为每一种预设情感类型的概率值。将P(e1),P(e2),…,P(ew)中最大值对应的情感类型,作为目标媒体信息的情感类型。通过利用量子理论的模型,可以更加有效的捕获不同模态之间的信息交互,进而可以提高对媒体信息所表达情绪的预测结果的精度。
-
公开(公告)号:CN116049413A
公开(公告)日:2023-05-02
申请号:CN202310346366.3
申请日:2023-04-03
Applicant: 北京中科闻歌科技股份有限公司 , 新华融合媒体科技发展(北京)有限公司
IPC: G06F16/35 , G06F18/22 , G06F18/2415 , G06N3/0455 , G06N3/047
Abstract: 本发明提供了一种基于事件演化的用户观点和立场获取方法,首先对输入的多个文本例如新闻进行文本聚类,然后对聚类结果进行清洗和合并以得到事件,然后针对事件的演化过程,抽取事件对应的评论者、观点和立场,最后按照事件的演化时间顺序,输出对应的评论者、观点和立场,能够根据事件的演变,推断评论者的观点、立场的变化情况。
-
公开(公告)号:CN115526338A
公开(公告)日:2022-12-27
申请号:CN202211287916.0
申请日:2022-10-20
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06N20/00 , G06F16/33 , G06F16/338
Abstract: 本申请涉及信息检索领域,特别是涉及一种用于信息检索的强化学习模型构建方法,所述方法包括:S100,获取查询信息Q的特征编码q和候选文档集合中各候选文档的特征编码;S200,构建MDP模型,其中:MDP模型的初始状态s0=[0,q],MDP模型的智能体在初始状态下选择动作a0的概率分布为π(a0|s0;w);S300,根据长期奖励对MDP模型进行模型训练。本发明提高了信息检索时文档排序的精确性。
-
公开(公告)号:CN113627151B
公开(公告)日:2022-02-22
申请号:CN202111199899.0
申请日:2021-10-14
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/211 , G06F40/216 , G06F40/242 , G06F40/289 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本公开涉及一种跨模态数据的匹配方法、装置、设备及介质。其中,跨模态数据的匹配方法包括:获取待匹配数据和候选数据,待匹配数据和候选数据的数据模态不同;对待匹配数据和候选数据进行量子化表示,得到待匹配数据与候选数据在量子复合系统内的分布信息;基于分布信息,提取待匹配数据与候选数据之间的量子干涉特征数据;在量子干涉特征数据满足预设匹配条件的情况下,确定候选数据和待匹配数据相匹配。根据本公开实施例,能够提高跨模态信息的匹配精度。
-
公开(公告)号:CN113656660A
公开(公告)日:2021-11-16
申请号:CN202111199634.0
申请日:2021-10-14
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/903 , G06K9/62 , G06N3/08 , G06N3/04
Abstract: 本公开涉及一种跨模态数据的匹配方法、装置、设备及介质。其中,跨模态数据的匹配方法包括:获取待匹配数据和候选数据,待匹配数据和候选数据的数据模态不同;对待匹配数据和候选数据进行量子化表示,得到待匹配数据与候选数据在量子复合系统内的分布信息;基于分布信息,进行相关性特征计算,得到待匹配数据与候选数据之间的相关性特征参数;在相关性特征参数满足预设匹配条件的情况下,确定待匹配数据与候选数据相互匹配。根据本公开实施例,能够提高跨模态信息的匹配精度。
-
公开(公告)号:CN113627151A
公开(公告)日:2021-11-09
申请号:CN202111199899.0
申请日:2021-10-14
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/211 , G06F40/216 , G06F40/242 , G06F40/289 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本公开涉及一种跨模态数据的匹配方法、装置、设备及介质。其中,跨模态数据的匹配方法包括:获取待匹配数据和候选数据,待匹配数据和候选数据的数据模态不同;对待匹配数据和候选数据进行量子化表示,得到待匹配数据与候选数据在量子复合系统内的分布信息;基于分布信息,提取待匹配数据与候选数据之间的量子干涉特征数据;在量子干涉特征数据满足预设匹配条件的情况下,确定候选数据和待匹配数据相匹配。根据本公开实施例,能够提高跨模态信息的匹配精度。
-
公开(公告)号:CN112364641B
公开(公告)日:2024-10-22
申请号:CN202011259475.4
申请日:2020-11-12
Applicant: 北京中科闻歌科技股份有限公司 , 深圳中科闻歌科技有限公司 , 国科智安(北京)科技有限公司
IPC: G06F40/284 , G06F40/166
Abstract: 本申请涉及一种面向文本审核的中文对抗样本生成方法及装置,其中方法包括:获取待处理语句信息;对待处理语句信息进行分词,得到多个词语;确定词语的第一重要性信息;获取各个词语对应的扰动词语;根据第一重要性信息,依次得到将待处理语句信息中各个词语替换为对应的扰动词语后的扰动语句信息;在确定扰动语句信息满足预设条件时,根据扰动语句信息得到对待处理语句信息攻击成功后的对抗样本。通过本实施例中的方法可以实现对待处理语句进行词语替换的方式得到对抗样本,进而可以增加用于对预测模型进行训练的样本的多样性,同时可以通过自动生成对抗样本,提升训练数据获取的便利性,提升模型训练的效率。
-
-
-
-
-
-
-
-
-