Patent search ap:("中国科学院信息工程研究所") AND inv:"曹亚男" Page 2

11.

发明公开
一种零样本对话状态追踪方法有权

公开(公告)号：CN118395994A

公开(公告)日：2024-07-26

申请号：CN202410327987.1

申请日：2024-03-21

Applicant: 中国科学院信息工程研究所

Inventor： 曹亚男 , 王青悦 , 方芳 , 尚燕敏 , 尹鹏飞 , 刘燕兵

IPC: G06F40/35 , G06F40/12 , G06F40/30 , G06F16/35 , G06N20/00 , G06N5/04

Abstract: 本发明公开了一种零样本对话状态追踪方法，其步骤包括：1)划分阶段：对于每一段对话状态标注的对话文本Ct，利用预训练语言模型f将对话文本Ct转换成对话文本向量et，然后利用聚类技术将各对话文本向量归类到其不同的子集中，得到K个子集；2)解决阶段：将子集中的每一文本向量作为一个样本，分别利用所得每一子集训练语义独立的状态追踪模型，共得到K个训练后的状态追踪模型；3)合并阶段：首先进行关系挖掘，将一个给定的对话文本C′t转换为语义向量e′t，计算每一子集的语义空间和对话文本C′t之间的关系δ；然后进行聚合推理，根据每一训练后的状态追踪模型及其对应的关系δ预测该对话文本C′t对应的对话状态。

12.

发明公开
基于类型感知的异质网络用户锚链接预测方法及电子装置有权

公开(公告)号：CN114625978A

公开(公告)日：2022-06-14

申请号：CN202011454130.4

申请日：2020-12-10

Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所

Inventor： 任博雅 , 李扬曦 , 佟玲玲 , 时磊 , 段东圣 , 井雅琪 , 胡燕林 , 尚燕敏 , 曹亚男

IPC: G06F16/9536 , G06K9/62 , G06N3/04 , G06N3/08 , G06Q50/00

Abstract: 本发明提供一种基于类型感知的异质网络用户锚链接预测方法及电子装置，包括收集待检测网络和目标网络的网络信息，构建待检测异质网络和目标异质网络；获取每一节点各维度的初始特征向量，得到每个节点的初始特征向量表示；将初始特征向量表示输入基于自注意力图神经网络进行学习，计算各节点的类型感知向量和类型融合向量；通过待检测异质网络和目标异质网络中各节点对之间属于同一类型的类型感知向量及类型融合向量的相似度，判断待检测网络和目标网络是否为锚链接。本发明采用注意力机制捕获节点与类型信息之间影响，利用图注意力网络学习类型感知向量和类型融合向量，解决异质网络中对多种类型信息建模的问题，取得较好的锚链接预测效果。

13.

发明授权
一种基于图文融合的生成式摘要生成方法有权

公开(公告)号：CN110704606B

公开(公告)日：2022-05-31

申请号：CN201910764261.3

申请日：2019-08-19

Applicant: 中国科学院信息工程研究所

Inventor： 曹亚男 , 徐灏 , 尚燕敏 , 刘燕兵 , 谭建龙 , 郭莉

IPC: G06F16/34 , G06F16/35 , G06F16/36 , G06T11/60

Abstract: 本发明公开了一种基于图文融合的生成式摘要生成方法，其步骤包括：1)将给定的文本数据集划分为训练集、验证集和测试集；其中，文本数据集中的每一样本是一三元组(X,I,Y)，X是文本，I是文本X对应的图像，Y是文本X的摘要；2)对文本数据集的图像进行实体特征提取，并将提取的实体特征表示成与文本同维度的图像特征向量；3)使用训练集和训练集对应的图像特征向量对生成式摘要模型进行训练；4)输入一条文本和对应图像并生成该图像的图像特征向量，然后将该文本及其对应的图像特征向量输入到训练后的生成式摘要模型，得到该文本对应的摘要。本发明生成的摘要可以有效地调整文本中实体的权重，在一定程度缓解未登录词的问题。

14.

发明公开
一种基于多关系融合分析的用户轨迹预测方法和系统有权

公开(公告)号：CN114461931A

公开(公告)日：2022-05-10

申请号：CN202111573021.9

申请日：2021-12-21

Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所

Inventor： 井雅琪 , 佟玲玲 , 方芳 , 段东圣 , 任博雅 , 段运强 , 时磊 , 曹亚男 , 尚燕敏

IPC: G06F16/9537 , G06K9/62 , G06N3/04 , G06Q10/04

Abstract: 本发明涉及一种基于多关系融合分析的用户轨迹预测方法和系统。该方法根据用户的历史轨迹相似关系和位置邻近关系，构建轨迹关系图，然后基于轨迹关系图中用户间的关系，利用融入注意力机制的轨迹预测模型对目标用户的未来轨迹进行预测。本发明充分考虑了用户出行具有的时间规律性特征，并充分挖掘了人群中的社会行为信息，预测精度具有明显的提高；本发明使用融入注意力机制的轨迹关系图来计算影响力大小，融入了不同用户对轨迹影响的差异，更加符合实际情况；本发明不仅利用了位置相邻的行人的轨迹行为信息，也考虑了历史轨迹相似用户的轨迹情况，将两种影响人群结合在一起构建轨迹关系图，解决了怎样对多种类型信息进行建模的问题。

15.

发明公开
一种基于门控循环单元的内部威胁检测方法和装置有权

公开(公告)号：CN113472742A

公开(公告)日：2021-10-01

申请号：CN202110588732.7

申请日：2021-05-28

Applicant: 中国科学院信息工程研究所

Inventor： 袁方方 , 刘燕兵 , 尚燕敏 , 曹亚男 , 谭建龙 , 郭莉

IPC: H04L29/06 , H04L12/24 , G06K9/62 , G06N3/04

Abstract: 本发明涉及一种基于门控循环单元的内部威胁检测方法和装置。该方法的步骤包括：解析用户审计日志以获取用户动作信息，将每个用户的动作按照时间先后顺序构建用户动作序列；利用门控循环单元GRU从用户动作序列中提取用户行为的时序特征；将提取的时序特征输入LR分类器进行分类，判别其为正常或异常，从而实现内部威胁检测。本发明融合多域的用户活动记录以全面地刻画用户行为，GRU可以更好地捕获用户动作序列的长期依赖，该方案能够实现用户行为细粒度的分析并提高了内部威胁检测的准确率。

16.

发明授权
一种基于生成对抗网络的中文摘要生成方法和装置有权

公开(公告)号：CN109766432B

公开(公告)日：2021-03-30

申请号：CN201810765723.9

申请日：2018-07-12

Applicant: 中国科学院信息工程研究所

Inventor： 曹亚男 , 徐灏 , 尚燕敏 , 刘燕兵 , 谭建龙 , 郭莉

IPC: G06F16/34 , G06F16/35

Abstract: 本发明涉及一种基于生成对抗网络的中文摘要生成方法和装置。该方法包括：1)通过对给定的中文数据集进行预处理操作形成训练集；2)构建基于生成对抗网络的中文摘要生成模型，并使用训练集对中文摘要生成模型进行训练；3)将待生成摘要的中文文本输入到训练完毕的中文摘要生成模型，得到对应的摘要。本发明使用判别器最小化误差来代替最大生成摘要概率的框架；特别设计了由3个LSTMs组成的判别器，能够更好地捕获特征，辅助分类效果；提出使用以字为单位结合上下文，能够有效提升文本摘要的效率。本发明能够对大规模中文文本进行摘要的自动生成，生成的摘要更自然、连贯，具有可读性。

17.

发明公开
一种基于多特征融合的社交群体分类方法及系统有权

公开(公告)号：CN110879856A

公开(公告)日：2020-03-13

申请号：CN201911180128.X

申请日：2019-11-27

Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所

Inventor： 李扬曦 , 佟玲玲 , 井雅琪 , 曹亚男 , 任博雅 , 胡燕林 , 时磊 , 段东圣 , 刘权

IPC: G06F16/901 , G06F16/906 , G06F16/909 , G06K9/62 , G06Q50/00

Abstract: 本发明公开了一种基于多特征融合的社交群体分类方法及系统。本方法为：1)对一目标社交群体的数据集，对该数据集中各用户的轨迹数据进行预处理，去除噪声并对缺失位置信息进行插值；2)使用频繁序列挖掘算法从各用户轨迹数据中挖掘对应用户的轨迹模式，再将用户的轨迹模式看作时序序列，采用LSTM对该时间序列进行编码，得到用户的轨迹编码；3)根据所述社交关系生成一图网络，将所述社交关系投影到低维空间，学习得到各用户的嵌入表示；4)将每一用户的轨迹编码和对应用户的嵌入表示结合输入softmax层，确定各用户的类别，实现对该目标社交群体的分类。本发明大大提升了群体分类的精度。

18.

发明公开
一种基于自动编码机的分布式离群点检测方法及系统无效

公开(公告)号：CN104008420A

公开(公告)日：2014-08-27

申请号：CN201410225026.6

申请日：2014-05-26

Applicant: 中国科学院信息工程研究所

Inventor： 马云龙 , 张鹏 , 曹亚男 , 翟立东 , 杜跃进

IPC: G06N3/08

Abstract: 本发明涉及一种基于自动编码机的分布式离群点检测方法及系统，包括定义训练数据集和测试数据集；将训练集的训练数据随机分配给若干个计算单元；所有计算单元并行执行，每个计算单元求解编码与解码参数；汇总每个计算单元的编码与解码参数得到最终编码与解码参数，构建一个自复制模型；将自复制模型应用到测试数据集上，并行计算每条测试数据的重建误差；按照重建误差降序排列测试数据，重建误差大于预定阈值的测试数据为离群点；本发明所述方法处理需要的总时间与处理的样本个数之间是独立的，仅仅取决于参数求解需要达到的精度；本发明非常适合基于MapReduce框架来处理大规模数据集上的离群点检测，具有良好的伸缩性与扩展性。

19.

发明公开
一种基于任务级别关系建模的小样本图节点分类方法和装置审中-实审

公开(公告)号：CN118332375A

公开(公告)日：2024-07-12

申请号：CN202410400399.6

申请日：2024-04-03

Applicant: 中国科学院信息工程研究所

Inventor： 曹亚男 , 周玉晨 , 尚燕敏 , 方芳 , 尹鹏飞 , 刘燕兵

IPC: G06F18/24 , G06F18/22 , G06F18/21 , G06N3/0985 , G06N3/0895 , G06N3/042 , G06N3/048 , G06N3/0464

Abstract: 本发明属于计算机数据挖掘分析技术领域，具体涉及一种基于任务级别关系建模的小样本图节点分类方法和装置。本发明利用对比学习方法来捕获元学习任务间的关系，通过拉近元学习任务图和原始图之间的距离捕获元任务间的相关性，通过拉远不同元学习任务图之间的距离捕获元任务间的差异性，整个方案遵循图元学习范式，对比学习作为子模块加入到图元学习框架中，最终通过联合优化完成小样本图节点分类任务。本发明设计了新的图元学习和图对比学习联合框架，利用对比学习建模了元学习任务间的复杂关系，在不引入额外标注信息的情况下，有效提升了小样本图节点分类任务的性能。

20.

发明公开
一种基于扩散模型的多粒度可控共情对话生成方法审中-实审

公开(公告)号：CN117909468A

公开(公告)日：2024-04-19

申请号：CN202410024770.3

申请日：2024-01-08

Applicant: 中国科学院信息工程研究所

Inventor： 曹亚男 , 毕冠群 , 方芳 , 尹鹏飞 , 刘燕兵

IPC: G06F16/332 , G06F16/33 , G06F16/35 , G06F40/35 , G06N20/00

Abstract: 本发明提出一种基于扩散模型的多粒度可控共情对话生成方法，属于文本生成领域。本发明首先通过提取标准回复的话语级别、句子级别和词语级别的控制因素，然后设计掩码矩阵进行细粒度控制，训练扩散模型；最后在共情对话生成阶段，从训练集中进行语义相似性和情绪一致性的匹配检索，将检索到的回复作为原型回复并提取控制因素，然后连同对话上下文输入到训练好的扩散模型中，获得最终的共情对话生成文本。本发明能够实现精细控制，生成的回复可以受到情绪不同程度影响，生成更加自然和适应上下文的共情回复，提高回复的多样性和复杂性。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification