Patent search ap:("国家计算机网络与信息安全管理中心" OR "恒安嘉新(北京)科技股份公司") AND inv:"任博雅" Page 5

41.

发明授权
一种实时文本数据流的特定信息识别方法及系统有权

公开(公告)号：CN111143553B

公开(公告)日：2023-04-07

申请号：CN201911244895.2

申请日：2019-12-06

Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所

Inventor： 李扬曦 , 任博雅 , 井雅琪 , 时磊 , 段东圣 , 余翠玲 , 胡燕林 , 佟玲玲 , 宋永浩 , 梁冬

IPC: G06F16/35 , G06F18/2415 , G06N3/045 , G06N3/09 , G06N3/047

Abstract: 本发明提出一种实时文本数据流的特定信息识别方法及系统。本发明主要解决的问题是针对海量实时文本数据流实现领域关注的特定信息识别。本发明提出一种针对海量实时文本数据流的特定信息识别框架及系统，侧重于具有海量性、实时性、多样化和复杂性特点的社交文本特定信息识别，并且实现能够适用于生产环境的社交大数据在线实时分析系统。本发明的目的在于根据互联网环境及手机短信网络环境下海量文本数据流，识别出文本中隐含的特定信息。

42.

发明公开
融合多源数据的Telegram中文群组检索方法、装置及设备审中-实审

公开(公告)号：CN115712738A

公开(公告)日：2023-02-24

申请号：CN202211429752.0

申请日：2022-11-15

Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所

Inventor： 井雅琪 , 郭孟汗 , 佟玲玲 , 段东圣 , 段运强 , 任博雅 , 刘晨 , 侯炜 , 赵万鹏 , 刘生辉

IPC: G06F16/383 , G06F40/289 , G06F18/25

Abstract: 本发明公开了一种融合多源数据的Telegram中文群组检索方法、装置及设备，所述方法包括：对获取检索词，并对所述检索词进行Telegram中文群组检索，生成多源融合群组；分析多源融合群组对应的群聊记录集合，得到特征词集合；基于特征词集合筛选所述多源融合群组，得到符合特征群组；对符合特征群组进行关联联想，生成关联联想群组；基于所述多源融合群组与符合特征群组集合，得到Telegram中文群组检索结果。本发明着重于解决Telegram中文群组检索困难。

43.

发明授权
一种短文本分类方法、装置和存储介质有权

公开(公告)号：CN110633366B

公开(公告)日：2022-12-16

申请号：CN201910697992.0

申请日：2019-07-31

Applicant: 国家计算机网络与信息安全管理中心

Inventor： 任博雅 , 李扬曦 , 刘权 , 胡燕林 , 佟玲玲 , 赵媛 , 徐雅静 , 程明飞 , 李静蕾 , 李思

IPC: G06F16/35 , G06V10/774 , G06V10/764

Abstract: 本发明提出了一种短文本分类方法、装置和存储介质，用以从有限的训练数据中获取泛化能力强并且较为准确的分类特征，提高短文本分类的准确性。所述短文本分类方法，包括：获取待分类短文本；将所述待分类短文本输入到多层分类器中，其中，所述多层分类器为利用训练样本和所述待分类短文本所属目标领域的领域知识图谱进行训练得到的，每一层分类器提取不同的文本特征进行训练；根据所述多层分类器的输出结果，确定所述待分类短文本对应的文本类别。

44.

发明公开
一种基于自适应损失函数的异常用户识别方法和装置有权

公开(公告)号：CN115034286A

公开(公告)日：2022-09-09

申请号：CN202210435266.3

申请日：2022-04-24

Applicant: 国家计算机网络与信息安全管理中心

Inventor： 井雅琪 , 段运强 , 佟玲玲 , 黎凌 , 胡燕林 , 段东圣 , 任博雅 , 孙旷怡 , 吕东 , 王媛媛 , 王子涵 , 侯炜 , 时磊

IPC: G06K9/62 , G06N3/04 , G06N3/08

Abstract: 本发明公开了一种基于自适应损失函数的异常用户识别方法和装置，其中，该方法包括：获取web系统的用户行为日志数据样本，并将用户行为日志数据样本向量化，得到无标签数据样本和有标签数据样本；进行数据预处理得到训练数据集；基于训练数据集的输入特征训练第一自编码器模型，并基于第一自编码器模型构造无标签数据样本损失函数和有标签数据样本损失函数；迭代优化第一自编码器模型并构造异常用户检测优化问题函数，得到第二自编码器模型；基于第二自编码器模型，对无标签数据样本进行异常点检测，以识别异常用户。本发明解决实际业务场景中，无标签数据中存在异常点，采用固定损失函数难以提高准确率，误报率高的技术问题。

45.

发明授权
一种基于多特征融合的社交群体分类方法及系统有权

公开(公告)号：CN110879856B

公开(公告)日：2022-08-05

申请号：CN201911180128.X

申请日：2019-11-27

Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所

Inventor： 李扬曦 , 佟玲玲 , 井雅琪 , 曹亚男 , 任博雅 , 胡燕林 , 时磊 , 段东圣 , 刘权

IPC: G06F16/901 , G06F16/906 , G06F16/909 , G06K9/62 , G06Q50/00

Abstract: 本发明公开了一种基于多特征融合的社交群体分类方法及系统。本方法为：1)对一目标社交群体的数据集，对该数据集中各用户的轨迹数据进行预处理，去除噪声并对缺失位置信息进行插值；2)使用频繁序列挖掘算法从各用户轨迹数据中挖掘对应用户的轨迹模式，再将用户的轨迹模式看作时序序列，采用LSTM对该时间序列进行编码，得到用户的轨迹编码；3)根据所述社交关系生成一图网络，将所述社交关系投影到低维空间，学习得到各用户的嵌入表示；4)将每一用户的轨迹编码和对应用户的嵌入表示结合输入softmax层，确定各用户的类别，实现对该目标社交群体的分类。本发明大大提升了群体分类的精度。

46.

发明授权
基于置信度的群体发现方法及装置有权

公开(公告)号：CN110674390B

公开(公告)日：2022-05-20

申请号：CN201910747703.3

申请日：2019-08-14

Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所

Inventor： 井雅琪 , 李扬曦 , 任博雅 , 杨亚茹 , 沈华伟 , 佟玲玲 , 时磊 , 王永庆 , 段运强 , 段东圣

IPC: G06F16/9535 , G06F16/9536

Abstract: 本发明公开了一种基于置信度的群体发现方法及装置，所述方法包括：步骤1，设置群体的约束条件，基于所述约束条件生成群体的候选用户集及候选网络；步骤2，基于所述候选用户集及所述候选网络综合得到每个候选用户属于该群体的置信度；步骤3，根据所述候选用户的置信度，与预先设置的置信度阈值进行比较，发现新种子用户和新候选用户；步骤4，获取新种子用户，重复执行步骤1‑4直到达到预先设置的迭代次数。

47.

发明公开
一种网络数据采集方法及系统有权

公开(公告)号：CN113132383A

公开(公告)日：2021-07-16

申请号：CN202110421317.2

申请日：2021-04-19

Applicant: 烟台中科网络技术研究所 , 国家计算机网络与信息安全管理中心

Inventor： 段东圣 , 王海洋 , 时磊 , 佟玲玲 , 段运强 , 任博雅 , 井雅琪 , 李真 , 张旋 , 田伟裕 , 王丽萍

IPC: H04L29/06 , H04L29/08 , G06N3/08

Abstract: 本发明涉及大数据技术领域。本发明公开了一种网络数据采集系统，该系统包括服务器，服务器包括：任务下发模块，用于创建用户信息获取任务，将用户信息获取任务分配至不同的任务池，计算任务池优先级，根据任务下发规则，得到并传输具有优先级参数的用户信息获取任务；数据解析模块，与任务下发模块数据连接，用于获取来自中间代理服务端的用户信息流量数据，数据解析模块构建报文解析神经网络模型，将待解析报文信息输入训练后报文解析神经网络模型，判断待解析报文信息中是否包括指定用户信息并提取。通过设置任务优先级，优先处理重要的任务，提高任务处理效率。本公开实施例还公开了一种网络数据采集方法。

48.

发明公开
一种转写文本校对方法及存储介质有权

公开(公告)号：CN112836493A

公开(公告)日：2021-05-25

申请号：CN202011404000.X

申请日：2020-12-04

Applicant: 国家计算机网络与信息安全管理中心

Inventor： 段运强 , 井雅琪 , 胡燕林 , 杜翠兰 , 李扬曦 , 佟玲玲 , 段东圣 , 任博雅 , 李鹏霄

IPC: G06F40/226 , G06F40/284 , G06F16/33

Abstract: 本发明公开了一种转写文本校对方法及存储介质，包括，基于预先构建的校对样本库对待校对文本按照不同文本粒度进行分析校对，获得对应的候选方案集；根据所述候选方案集确定校对方案，并通过所述校对方案确定校对结果。本发明方法基于预先构建的校对样本库对待校对文本按照不同文本粒度进行分析校对，获得对应的候选方案集；根据所述候选方案集确定校对方案，由此从不同的文本粒度出发确定校对方案，提高了转写文本的准确性和语义的合理性。

49.

发明公开
一种数据脱敏方法、装置可读存储介质无效

公开(公告)号：CN112632597A

公开(公告)日：2021-04-09

申请号：CN202011420230.5

申请日：2020-12-08

Applicant: 国家计算机网络与信息安全管理中心

Inventor： 佟玲玲 , 任博雅 , 李鹏霄 , 段东圣 , 杜翠兰 , 李扬曦 , 段运强 , 项菲 , 井雅琪

IPC: G06F21/62 , G06F21/60 , G06N20/00 , G06F16/25

Abstract: 本发明公开了一种数据脱敏方法、装置可读存储介质，其中方法包括：根据获取的用户提交的数据文件通过预先训练的标注模型对所述数据文件中的敏感数据进行标注，以获得标注文件；利用预设评测规则对与所述标注文件的文件类型相匹配的脱敏算法进行评测；根据用户从评测结果中选取的脱敏算法完成对所述标注文件的脱敏。本发明利用预设评测规则对与标注文件的文件类型相匹配的脱敏算法进行评测；根据用户从评测结果中选取的脱敏算法完成对标注文件的脱敏，由此可以通过规则评测和用户选择确定对应的脱敏算法，具有广泛的适用性。

50.

发明公开
一种短文本分类方法、装置和存储介质有权

公开(公告)号：CN110633366A

公开(公告)日：2019-12-31

申请号：CN201910697992.0

申请日：2019-07-31

Applicant: 国家计算机网络与信息安全管理中心

Inventor： 任博雅 , 李扬曦 , 刘权 , 胡燕林 , 佟玲玲 , 赵媛 , 徐雅静 , 程明飞 , 李静蕾 , 李思

IPC: G06F16/35 , G06K9/62

Abstract: 本发明提出了一种短文本分类方法、装置和存储介质，用以从有限的训练数据中获取泛化能力强并且较为准确的分类特征，提高短文本分类的准确性。所述短文本分类方法，包括：获取待分类短文本；将所述待分类短文本输入到多层分类器中，其中，所述多层分类器为利用训练样本和所述待分类短文本所属目标领域的领域知识图谱进行训练得到的，每一层分类器提取不同的文本特征进行训练；根据所述多层分类器的输出结果，确定所述待分类短文本对应的文本类别。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification