Patent search ap:("国家计算机网络与信息安全管理中心" OR "中国科学院信息工程研究所") AND inv:"任博雅" Page 1

1.

发明公开
一种基于BERT的高精度文本分类方法及装置审中-实审

公开(公告)号：CN115269834A

公开(公告)日：2022-11-01

申请号：CN202210782688.8

申请日：2022-06-28

Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所

Inventor： 井雅琪 , 时磊 , 佟玲玲 , 李扬曦 , 段东圣 , 任博雅 , 段运强 , 曹亚男 , 方芳

IPC: G06F16/35 , G06N3/04 , G06N3/08

Abstract: 本发明公开了一种基于BERT的高精度文本分类方法及装置，在输入端采用FastText模型，对词汇进行嵌入表示得到表示向量，然后把表示向量作为BERT模型的输入，将BERT的输出结果接上全连接层+softmax，实现文本分类。本发明提前用FastText模型处理语料数据，获取字符的特征，解决了OOV的embedding问题，同时获取词的形态变换，对富有词型变换的语料具有更好的表示能力；使用BERT能够提前预训练大量的语料，增加了词向量的语义丰富度，获得更好的上下文表示；在BERT模型的输出添加全连接层和softmax进行文本分类，提高了文本分类的精度。

2.

发明授权
基于类型感知的异质网络用户锚链接预测方法及电子装置有权

公开(公告)号：CN114625978B

公开(公告)日：2024-11-08

申请号：CN202011454130.4

申请日：2020-12-10

Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所

Inventor： 任博雅 , 李扬曦 , 佟玲玲 , 时磊 , 段东圣 , 井雅琪 , 胡燕林 , 尚燕敏 , 曹亚男

IPC: G06F18/22 , G06F18/25 , G06N3/042 , G06N3/045 , G06N3/0464 , G06N3/0985 , G06F16/9536 , G06Q50/00

Abstract: 本发明提供一种基于类型感知的异质网络用户锚链接预测方法及电子装置，包括收集待检测网络和目标网络的网络信息，构建待检测异质网络和目标异质网络；获取每一节点各维度的初始特征向量，得到每个节点的初始特征向量表示；将初始特征向量表示输入基于自注意力图神经网络进行学习，计算各节点的类型感知向量和类型融合向量；通过待检测异质网络和目标异质网络中各节点对之间属于同一类型的类型感知向量及类型融合向量的相似度，判断待检测网络和目标网络是否为锚链接。本发明采用注意力机制捕获节点与类型信息之间影响，利用图注意力网络学习类型感知向量和类型融合向量，解决异质网络中对多种类型信息建模的问题，取得较好的锚链接预测效果。

3.

发明公开
融合多源数据的Telegram中文群组检索方法、装置及设备审中-实审

公开(公告)号：CN115712738A

公开(公告)日：2023-02-24

申请号：CN202211429752.0

申请日：2022-11-15

Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所

Inventor： 井雅琪 , 郭孟汗 , 佟玲玲 , 段东圣 , 段运强 , 任博雅 , 刘晨 , 侯炜 , 赵万鹏 , 刘生辉

IPC: G06F16/383 , G06F40/289 , G06F18/25

Abstract: 本发明公开了一种融合多源数据的Telegram中文群组检索方法、装置及设备，所述方法包括：对获取检索词，并对所述检索词进行Telegram中文群组检索，生成多源融合群组；分析多源融合群组对应的群聊记录集合，得到特征词集合；基于特征词集合筛选所述多源融合群组，得到符合特征群组；对符合特征群组进行关联联想，生成关联联想群组；基于所述多源融合群组与符合特征群组集合，得到Telegram中文群组检索结果。本发明着重于解决Telegram中文群组检索困难。

4.

发明授权
一种基于多特征融合的社交群体分类方法及系统有权

公开(公告)号：CN110879856B

公开(公告)日：2022-08-05

申请号：CN201911180128.X

申请日：2019-11-27

Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所

Inventor： 李扬曦 , 佟玲玲 , 井雅琪 , 曹亚男 , 任博雅 , 胡燕林 , 时磊 , 段东圣 , 刘权

IPC: G06F16/901 , G06F16/906 , G06F16/909 , G06K9/62 , G06Q50/00

Abstract: 本发明公开了一种基于多特征融合的社交群体分类方法及系统。本方法为：1)对一目标社交群体的数据集，对该数据集中各用户的轨迹数据进行预处理，去除噪声并对缺失位置信息进行插值；2)使用频繁序列挖掘算法从各用户轨迹数据中挖掘对应用户的轨迹模式，再将用户的轨迹模式看作时序序列，采用LSTM对该时间序列进行编码，得到用户的轨迹编码；3)根据所述社交关系生成一图网络，将所述社交关系投影到低维空间，学习得到各用户的嵌入表示；4)将每一用户的轨迹编码和对应用户的嵌入表示结合输入softmax层，确定各用户的类别，实现对该目标社交群体的分类。本发明大大提升了群体分类的精度。

5.

发明授权
一种融合LSTM与场景规则知识的异常轨迹检测方法及装置有权

公开(公告)号：CN114021627B

公开(公告)日：2025-04-22

申请号：CN202111239649.5

申请日：2021-10-25

Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所

Inventor： 井雅琪 , 佟玲玲 , 段东圣 , 任博雅 , 段运强 , 时磊 , 王红兵 , 方芳 , 尹鹏飞

IPC: G06F18/25 , G06F18/2411 , G06N3/0442 , G06N3/08

Abstract: 本发明公开了一种融合LSTM与场景规则知识的异常轨迹检测方法及装置，包括依据目标轨迹构建时序序列；将时序序列输入LSTM网络，获取的目标轨迹中每个时刻的位置隐向量，并基于各位置隐向量进行注意力机制计算，得到目标轨迹表示向量；拼接目标轨迹表示向量与设定场景规则的向量，并对拼接后向量进行分类，得到异常轨迹检测结果。本发明采用的融合方法除了使用向量表示轨迹之外，还加入了可调整的应用场景规则，解决单一方法的不足，具有更好的迁移性。

6.

发明授权
一种面向噪声文本的多视角交互匹配方法及电子装置有权

公开(公告)号：CN114626425B

公开(公告)日：2024-11-08

申请号：CN202011456860.8

申请日：2020-12-10

Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所

Inventor： 井雅琪 , 李扬曦 , 佟玲玲 , 任博雅 , 段东圣 , 段运强 , 胡燕林 , 方芳 , 尹鹏飞

IPC: G06F18/22 , G06F40/30 , G06F40/284 , G06N3/0464 , G06N3/045 , G06N3/0442 , G06N3/084

Abstract: 本发明提供一种面向噪声文本的多视角交互匹配方法及电子装置，包括对两段待匹配噪声文本分别编码，得到两段编码向量序列，并向两段编码向量序列的每个编码向量中加入位置信息；对加入位置信息的两段编码向量序列进行内部交互，分别得到两段内部交互结果；对两段内部交互结果进行外部交互，分别构建两个双向的噪声文本交互矩阵；拼接两个噪声文本交互矩阵，判断两个待匹配噪声文本是否匹配。本发明采用注意力机制捕获噪声文本之间的双向匹配模式，受噪声文本中句子的逻辑顺序影响较小，增加文本有效语义单词影响，提高模型时间效率及噪声文本匹配效果，避免传递匹配问题。

7.

发明授权
一种基于多关系融合分析的用户轨迹预测方法和系统有权

公开(公告)号：CN114461931B

公开(公告)日：2024-11-08

申请号：CN202111573021.9

申请日：2021-12-21

Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所

Inventor： 井雅琪 , 佟玲玲 , 方芳 , 段东圣 , 任博雅 , 段运强 , 时磊 , 曹亚男 , 尚燕敏

IPC: G06F16/9537 , G06N3/0442 , G06F18/22 , G06F18/23 , G06Q10/04

Abstract: 本发明涉及一种基于多关系融合分析的用户轨迹预测方法和系统。该方法根据用户的历史轨迹相似关系和位置邻近关系，构建轨迹关系图，然后基于轨迹关系图中用户间的关系，利用融入注意力机制的轨迹预测模型对目标用户的未来轨迹进行预测。本发明充分考虑了用户出行具有的时间规律性特征，并充分挖掘了人群中的社会行为信息，预测精度具有明显的提高；本发明使用融入注意力机制的轨迹关系图来计算影响力大小，融入了不同用户对轨迹影响的差异，更加符合实际情况；本发明不仅利用了位置相邻的行人的轨迹行为信息，也考虑了历史轨迹相似用户的轨迹情况，将两种影响人群结合在一起构建轨迹关系图，解决了怎样对多种类型信息进行建模的问题。

8.

发明公开
基于问答机制的文本变体词识别方法、装置及设备审中-实审

公开(公告)号：CN118709688A

公开(公告)日：2024-09-27

申请号：CN202410746400.0

申请日：2024-06-11

Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所

Inventor： 段运强 , 井雅琪 , 侯炜 , 吕东 , 段荣昌 , 段东圣 , 佟玲玲 , 曹亚男 , 尚燕敏 , 任博雅 , 李鹏霄 , 尹鹏飞

IPC: G06F40/295 , G06F40/242 , G06N5/04 , G06N3/0455 , G06N3/0499 , G06N3/082

Abstract: 本发明公开一种基于问答机制的文本变体词识别方法、装置及设备，属于文本信息识别领域。所述方法包括：构建变体词库，并通过汉字的字形和拼音的分别编码对所述变体词库进行数据增强；在数据增强后的变体词库上训练一变体词推理模型，所述变体词推理模型的网络结构包括：一语言表征模型和两个独立的全连接层；将问答模板与文本内容相连接后输入所述变体词推理模型，得到文本内容中变体词的起始位置概率和结束位置概率；基于变体词的起始位置概率和结束位置概率确定变体词的确切边界，得到文本内容中变体词的识别结果。本发明不仅能够提高变体词识别的准确性，还能够有效地降低模型的维护成本，增强其在实际应用中的适应性和鲁棒性。

9.

发明公开
一种基于难度序列推理的篇章级事件论元抽取方法及系统审中-实审

公开(公告)号：CN118708728A

公开(公告)日：2024-09-27

申请号：CN202410746389.8

申请日：2024-06-11

Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所

Inventor： 段运强 , 井雅琪 , 段荣昌 , 侯炜 , 吕东 , 佟玲玲 , 段东圣 , 曹亚男 , 尚燕敏 , 任博雅 , 李鹏霄 , 尹鹏飞

IPC: G06F16/36 , G06F16/33 , G06N5/04 , G06N3/0455 , G06N3/08

Abstract: 本发明公开了一种基于难度序列推理的篇章级事件论元抽取方法及系统，属于文本信息抽取领域。本发明根据文档上下文选择对应的提示学习模板，对上下文和提示学习模板进行编码，得到上下文表示和提示表示，该提示表示包含论元角色的向量表示；根据每个论元角色的向量表示计算每个论元角色的预测困难分数，根据预测困难份数对论元角色进行排序，得到预测的推理路径；按照预测的推理路径的顺序进行信息推理，得到每个论元角色的推理概率分布；根据得到的每个论元角色的推理概率分布，预测每个论元角色的位置并抽取论元。本发明能够利用简单论元的信息来帮助抽取困难的论元。

10.

发明公开
一种融合LSTM与场景规则知识的异常轨迹检测方法及装置有权

公开(公告)号：CN114021627A

公开(公告)日：2022-02-08

申请号：CN202111239649.5

申请日：2021-10-25

Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所

Inventor： 井雅琪 , 佟玲玲 , 段东圣 , 任博雅 , 段运强 , 时磊 , 王红兵 , 方芳 , 尹鹏飞

IPC: G06K9/62 , G06N3/04 , G06N3/08

Abstract: 本发明公开了一种融合LSTM与场景规则知识的异常轨迹检测方法及装置，包括依据目标轨迹构建时序序列；将时序序列输入LSTM网络，获取的目标轨迹中每个时刻的位置隐向量，并基于各位置隐向量进行注意力机制计算，得到目标轨迹表示向量；拼接目标轨迹表示向量与设定场景规则的向量，并对拼接后向量进行分类，得到异常轨迹检测结果。本发明采用的融合方法除了使用向量表示轨迹之外，还加入了可调整的应用场景规则，解决单一方法的不足，具有更好的迁移性。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification