-
公开(公告)号:CN116882409A
公开(公告)日:2023-10-13
申请号:CN202311154862.5
申请日:2023-09-08
Applicant: 中国科学院自动化研究所
IPC: G06F40/295 , G06F18/24 , G06F18/25
Abstract: 本发明提供一种异常账号检测方法、装置、电子设备及存储介质,应用于社交媒体分析技术领域。该方法包括:获取待测账号的账号信息;根据所述账号信息确定所述待测账号的序列特征、文本特征以及数值特征;将所述序列特征、所述文本特征以及所述数值特征进行特征融合处理,得到所述待测账号的目标表示向量;基于所述目标表示向量检测所述待测账号是否为异常账号;其中,所述序列特征用于表示所述待测账号的发帖内容变化趋势和发帖数量变化趋势;所述文本特征用于表示与所述待测账号相关的文本内容的特征,所述数值特征用于表示所述待测账号的热度和关注度。
-
公开(公告)号:CN116821290A
公开(公告)日:2023-09-29
申请号:CN202310638543.5
申请日:2023-05-31
Applicant: 中国科学院自动化研究所
IPC: G06F16/332 , G06F16/35 , G06F18/214 , G06F18/241
Abstract: 本发明提供一种面向多任务对话的大语言模型训练方法和交互方法,其中面向多任务对话的大语言模型训练方法包括:获取通用对话数据和任务对话数据,并确定所述任务对话数据对应的任务类别和任务目标;基于所述通用对话数据,对初始大语言模型进行模型微调,得到第一大语言模型;基于所述任务类别和所述任务目标,对所述任务对话数据进行任务标注,得到目标对话数据;基于所述目标对话数据,对所述第一大语言模型进行模型微调,得到大语言模型,不仅在极大程度上保留了模型的闲聊交互能力,还最大限度的提升了模型的任务识别能力和任务执行能力,使其能够具备快速准确地识别任务类别和任务目标的能力,优化了模型性能。
-
公开(公告)号:CN111291139B
公开(公告)日:2023-08-22
申请号:CN202010189960.2
申请日:2020-03-17
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于知识图谱领域,具体涉及一种基于注意力机制的知识图谱长尾关系补全方法、系统、装置,旨在解决传统的关系补全模型因长尾关系数目稀少导致对长尾关系预测产生过拟合的问题。本系统方法:获取待补全的知识图谱,并根据其实体之间的关系类型将其构建为第一知识图谱和第二知识图谱;获取第一知识图谱中融合邻域信息的实体向量表示,作为第一表示;根据第一表示对第二知识图谱中各实体进行向量化表示,并构建支撑集和查询集;通过预设的多种网络类型的长尾关系预测方法获取查询集中各实体对的关系类型标签,并补全各实体之间的关系。本发明通过对知识图谱中各实体的邻域信息进行融合,避免了长尾关系预测时过拟合的问题。
-
公开(公告)号:CN115062787A
公开(公告)日:2022-09-16
申请号:CN202210581040.4
申请日:2022-05-25
Applicant: 中国科学院自动化研究所
IPC: G06N20/00 , G06F40/232 , G06F40/279
Abstract: 本发明提供一种对比学习模型的训练方法及装置、汉字表示方法及装置,其中对比学习模型的训练方法包括:基于相似汉字混淆集中的各混淆汉字构建相似汉字簇集合,所述相似汉字簇集合包括字音相似汉字簇集合和字形相似汉字簇集合;根据所述字音相似汉字簇集合、所述字形相似汉字簇集合构建样本汉字三元组集合;将所述样本汉字三元组集合输入对比学习模型进行训练,直至达到训练停止条件。利用包含有字音相似汉字簇集合和字形相似汉字簇集合的样本汉字三元组集合对对比学习模型进行训练,可以得到汉字之间字音字形的相似关系,丰富了汉字之间字音字形相似关系的表达。
-
公开(公告)号:CN114139556A
公开(公告)日:2022-03-04
申请号:CN202111271484.X
申请日:2021-10-29
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种多语言翻译方法、装置、电子设备及存储介质,方法包括:获取训练数据和源语言的文本;其中,训练数据包括源语言到多种目标语言的双语平行句对和多语言平行句对;对源语言的文本进行编码,得到源语言的文本对应的特征向量;其中,特征向量与目标语言无关;基于特征向量和多种目标语言已生成的译文,确定多种目标语言的当前词的最终表示;基于语言独立的柱搜索算法及多种目标语言的当前词的最终表示,对多种目标语言的已生成最优候选译文进行扩展,得到多种目标语言的目标译文。本发明提供的方法,能够利用多种目标语言之间的互补信息,生成多种目标语言的目标译文,同时提升多种目标语言的翻译质量。
-
公开(公告)号:CN114048760A
公开(公告)日:2022-02-15
申请号:CN202111138690.3
申请日:2021-09-27
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种多语言机器翻译模型训练方法、多语言翻译方法及装置。训练方法包括:获取多语言翻译训练语料和多语言翻译验证语料;建立并初始化全参数共享的多语言翻译模型,利用多语言翻译训练语料和多语言翻译验证语料对多语言翻译模型进行训练,得到多语言机器翻译模型。在训练过程中模型自动判断每个共享的参数是否需要转变为语言相关的参数,复制需要转变的参数并将其分配给相关的语言,从而使得模型同时具有共享参数和语言相关参数。本发明用于在多语言机器翻译模型训练的过程中,自动判断参数是否需要共享以及需要被哪些语言对共享,而不依赖预先指定的共享或语言相关的模型组件。
-
公开(公告)号:CN109213851B
公开(公告)日:2021-05-25
申请号:CN201810724523.9
申请日:2018-07-04
Applicant: 中国科学院自动化研究所 , 出门问问信息科技有限公司
IPC: G06F16/332 , G06F40/58 , G06F40/30
Abstract: 本发明涉及语言处理领域,并提出了一种对话系统中口语理解的跨语言迁移方法,旨在解决在对话系统中口语理解的跨语言迁移中,因语义标签难以迁移和语言文化差异造成迁移结果质量不佳的技术问题。为此目的,本发明中的口语的跨语言迁移方法包括:获取待迁移的有标注口语理解数据;利用预先构建的口语理解迁移模型对所述带类别标记的待迁移数据进行迁移,得到带类别标记的第一迁移结果;对第一迁移结果进行文化迁移,得到目标语言的口语理解数据。基于上述步骤,本发明可以快速、准确的对口语理解数据进行跨语言迁移,改善了因为双语带类别标记数据不足而导致的有监督训练方法效果不佳的问题,降低了在模型训练中的数据收集和标注成本。
-
公开(公告)号:CN112131372A
公开(公告)日:2020-12-25
申请号:CN202011337142.9
申请日:2020-11-25
Applicant: 中国科学院自动化研究所
IPC: G06F16/332 , G06F40/295 , G16H80/00 , G06N3/08
Abstract: 本发明属于人机对话领域,具体涉及一种基于知识驱动的对话策略网络优化方法、系统、装置,旨在解决医疗领域现有对话系统优化过程中训练数据利用率低的问题。本发明方法应用于对话系统的训练,包括:基于选定领域对话样本的输入特征,利用基于编码器的协同过滤的方法,对自编码器进行优化;所述自编码器中的编码器用于将输入特征映射到低维空间;基于包含额外奖励值的损失函数,对对话策略网络进行优化;所述额外奖励值与行为动作空间中状态‑动作对出现的频率呈反比例关系。本发明可在有限的训练数据的情况下充分地探索状态动作空间,提高数据利用率。
-
公开(公告)号:CN108536735B
公开(公告)日:2020-12-15
申请号:CN201810178559.1
申请日:2018-03-05
Applicant: 中国科学院自动化研究所
IPC: G06F16/9032 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明涉及自然语言处理领域,具体涉及一种基于多通道自编码器的多模态词汇表示方法与系统,目的在于提高表示结果的准确性。本发明的词汇表示方法,先通过向量数据库查询待表示词汇的文本模态向量、视觉模态向量、音频模态向量;对于没有视觉模态和音频模态的词汇,利用训练好的映射模型去预测缺失的视觉向量以及听觉向量;再计算上述三种向量与对应模态权重的点积;最后将上述加权后的向量作为多通道自编码器模型的输入,对三种模态的信息进行融合,得到多模态的词汇表示向量。本发明利用不同模态间的相关性,融合不同模态的信息,并引入模态权重,有效提高了词汇表示的准确度。为了对不同模态进行更好的融合,还加入了联想词汇预测模块。
-
公开(公告)号:CN109190109B
公开(公告)日:2020-09-29
申请号:CN201810833407.0
申请日:2018-07-26
Applicant: 中国科学院自动化研究所
IPC: G06F40/258 , G06F16/35 , G06N3/04 , G06N3/08
Abstract: 本发明属于情感分类技术领域,具体提供了一种融合用户信息生成评论摘要的方法及装置,旨在解决现有技术忽略用户信息导致生成的评论摘要不准确的问题。为此目的,本发明提供了一种融合用户信息生成评论摘要的方法,包括基于预先获取的评论信息以及相应的用户信息和评论标题获取评论向量;基于预先构建的评论摘要生成模型并根据评论向量,获取评论向量对应的评论摘要;其中,评论摘要生成模型是基于预设的语料集并利用机器学习算法所构建的神经网络模型。基于上述步骤,本发明提供的方法可以根据不同用户关注评论信息中不同的评价对象,充分考虑不同的用户的用词习惯的差异性,生成准确的评论摘要。
-
-
-
-
-
-
-
-
-