Patent search ap:("国家计算机网络与信息安全管理中心" OR "拓尔思信息技术股份有限公司") AND inv:"李欣" Page 4

31.

发明授权
面向微博用户的心理画像方法有权

公开(公告)号：CN110096575B

公开(公告)日：2022-02-01

申请号：CN201910375599.X

申请日：2019-05-07

Applicant: 国家计算机网络与信息安全管理中心 , 北京航空航天大学

Inventor： 赵忠华 , 吴俊杰 , 赵志云 , 袁石 , 王禄恒 , 左源 , 付培国 , 万欣欣 , 李欣 , 王涵菲

IPC: G06F16/33 , G06F16/958 , G16H10/20 , G16H20/70

Abstract: 本发明公开了一种面向微博用户的心理画像方法，包括：步骤一、在微博平台上选取样本用户，根据设定的心理学量表，利用调查问卷法获取样本用户的人格特征得分；步骤二、根据所述样本用户在微博平台上的文本信息，获取样本用户的文本表征，根据所述样本用户的行为信息，获取样本用户的行为表征；步骤三、根据样本用户的人格特征得分与文本表征和行为表征的对应关系，构建人格特征预测模型；步骤四、获取待测用户的文本表征和行为表征，根据人格特征预测模型，获得待测用户的人格特征。本发明能够实现对微博用户的人格特质的分析，为微博用户的心理画像提供技术支持。

32.

发明公开
强化聚合知识指导的生成常识推理方法有权

公开(公告)号：CN113255918A

公开(公告)日：2021-08-13

申请号：CN202110393843.2

申请日：2021-04-13

Applicant: 国家计算机网络与信息安全管理中心

Inventor： 李欣 , 赵志云 , 葛自发 , 孙小宁 , 张冰 , 万欣欣 , 袁钟怡 , 赵忠华 , 孙立远 , 付培国 , 王禄恒 , 王晴

IPC: G06N5/04 , G06F16/36 , G06N5/02 , G06K9/62 , G06F40/126

Abstract: 本发明公开了一种强化聚合知识指导的生成常识推理方法，包括：基于知识图谱构建概念推理图和分层概念扩展图；搭建强化聚合指导下基于概念推理图的知识图谱增强型编码器；搭建强化聚合指导下基于分层概念扩展图的知识图谱增强型解码器；训练包含知识图谱增强型编码器和知识图谱增强型解码器的生成常识推理模型；应用训练后的生成常识推理模型生成常识推理语句。本发明提供的方法可以有效避免因未考虑概念之间关系而导致生成语句不符合日常情景、逻辑不合理等一系列问题，通过引入强化聚合过程从知识图谱中筛选能提供丰富关系信息的附加概念描述，有效提升了模型对不可见概念集的概括。

33.

发明公开
一种基于网信领域短文本的观点挖掘方法有权

公开(公告)号：CN113220964A

公开(公告)日：2021-08-06

申请号：CN202110357064.7

申请日：2021-04-01

Applicant: 国家计算机网络与信息安全管理中心

Inventor： 付培国 , 孙立远 , 王禄恒 , 葛自发 , 万欣欣 , 李欣 , 周亚东 , 边策 , 高泱晗

IPC: G06F16/951 , G06F16/9032 , G06F16/955 , G06F40/242 , G06F40/284 , G06N3/04 , G06N3/08 , G06Q50/00

Abstract: 本发明属于网络信息以及自然语言处理技术领域，特别涉及一种基于网信领域短文本的观点挖掘方法。本方法包括网信领域相关的数据获取与预处理模块、基于短文本的特征提取模块、短文本属性推断模块、观点挖掘结果输出模块。本发明方法提出了基于网信领域的短文本获取与数据清洗模型，建立了面向社交网络短文本的文本特征提取模型，设计了基于网信领域的社交网络短文本的属性推断模型，综合考虑了文本关键词抽取和摘要生成，提出对应的观点挖掘输出模型，最终基于实际采集的网络安全法相关短文本数据实现输出及可视化的展示。本发明极大地减少了人工收集、分析与网信领域相关的短文本的时间成本，能够有效的为网信领域相关专业人士提供观点挖掘结果。

34.

发明公开
一种主题相关度判别方法及装置有权

公开(公告)号：CN112214558A

公开(公告)日：2021-01-12

申请号：CN202011296138.2

申请日：2020-11-18

Applicant: 国家计算机网络与信息安全管理中心

Inventor： 李欣 , 赵志云 , 葛自发 , 孙小宁 , 张冰 , 万欣欣 , 袁钟怡 , 赵忠华 , 孙立远 , 付培国 , 王禄恒 , 王晴

IPC: G06F16/28 , G06F16/33 , G06F16/951 , G06N3/04 , G06N3/08

Abstract: 本申请提供了一种主题相关度判别方法及装置，方法包括：对获取的网页构建网页特征向量；利用预先训练的语义向量空间模型对选定的主题特征向量与网页特征向量之间的相似度进行计算；筛选出相似度高于预设值的网页特征向量。本申请结合了语义向量相似度计算和机器学习方法的优点，相比于现有技术，可以实现较高的判别精度，并且本申请在训练样本的筛选上也作出了不同于现有技术的改进。

35.

发明公开
不同数据源的数据抽取方法、装置、设备及存储介质无效

公开(公告)号：CN111858728A

公开(公告)日：2020-10-30

申请号：CN202010605313.5

申请日：2020-06-29

Applicant: 国家计算机网络与信息安全管理中心

Inventor： 李欣 , 赵志云 , 葛自发 , 孙小宁 , 张冰 , 万欣欣 , 袁钟怡 , 赵忠华 , 孙立远 , 付培国 , 王禄恒 , 王晴

IPC: G06F16/25

Abstract: 本发明公开了不同数据源的数据抽取方法，包括：获取数据源和数据源属性名，计算数据源属性名与预设属性名的相似度，若所述相似度大于预设阈值，则建立所述数据源属性名与所述预设属性名的映射关系，构建属性名映射表；根据所述属性名映射表，获取与所述预设属性名对应的不同数据源，根据数据源的优先级，按照设定的抽取规则抽取数据入库；以及，不同数据源的数据抽取装置，设备和存储介质。本发明通过自动化创建属性名映射表，可以对不同数据源的数据进行自动抽取，高效地构建不同领域的知识库并自动化更新，成本低。

36.

发明公开
基于BERT模型和K近邻的敏感信息识别方法及系统有权

公开(公告)号：CN111581956A

公开(公告)日：2020-08-25

申请号：CN202010269087.8

申请日：2020-04-08

Applicant: 国家计算机网络与信息安全管理中心 , 北京航空航天大学

Inventor： 赵忠华 , 吴俊杰 , 赵志云 , 葛自发 , 孙小宁 , 张冰 , 王欣欣 , 李欣 , 袁钟怡 , 孙立远 , 付培国 , 王禄恒 , 左源 , 李丰志 , 李英汉 , 户中方

IPC: G06F40/279 , G06F40/216 , G06F40/242 , G06F40/126 , G06F16/335 , G06F16/35 , G06K9/62

Abstract: 本发明公开了一种基于BERT模型和K近邻的敏感信息识别方法，包括：步骤一、对文本进行预处理；步骤二、标注多条预处理文本为敏感信息和非敏感信息，步骤三、表征得到敏感信息的向量表征和非敏感信息的向量表征；步骤四、以敏感信息的向量表征为正类数据、以非敏感信息的向量表征为负类数据，构建近似最邻近搜索图；步骤五、将待测文本的向量表征输入至近似最邻近搜索图，搜索得到近似最近邻的K个节点，判断节点属性及根据该条待测文本的敏感度权重，修正其敏感度值后，判断是否为敏感信息。本发明公开了一种基于BERT模型和K近邻的敏感信息识别系统。本发明具有提升文本质量，提升敏感信息识别的速度和精度的有益效果。

37.

发明公开
一种数据集构建和相关信息获取方法及其装置有权

公开(公告)号：CN111353300A

公开(公告)日：2020-06-30

申请号：CN202010093817.3

申请日：2020-02-14

Applicant: 中科天玑数据科技股份有限公司 , 国家计算机网络与信息安全管理中心

Inventor： 王立成 , 刘贺鹏 , 李欣 , 赵忠华 , 付培国 , 王禄恒 , 万欣欣 , 孙立远 , 张冰 , 杜漫 , 余智华

IPC: G06F40/284 , G06F40/289 , G06K9/62

Abstract: 本发明提供了一种数据集构建方法及装置，包括步骤：数据采集，获取来自互联网数据源的第一数据，所述第一数据包括自然语言，所述第一数据经过预处理后，生成第二数据；数据特征分析，所述第二数据包括子数据，所述子数据包括第一特征数据，分析所述第一特征数据，得出所述第一特征数据的特征度；数据标签建立，根据所述第一特征数据的特征度确定所述子数据标签；数据分类存储，根据所述子数据标签将所述子数据分类保存，保存为数据集。实时采集互联网中的数据；根据特征数据和特征度提取对应的标签；通过所述子数据标签将所述子数据进行分类提高提取速度，提高工作效率。本发明提供了一种相关信息获取方法及装置，提高准确性，提高工作效率。

38.

发明公开
舆情分析工作流系统及其方法审中-实审

公开(公告)号：CN115293479A

公开(公告)日：2022-11-04

申请号：CN202210559536.1

申请日：2022-05-23

Applicant: 国家计算机网络与信息安全管理中心 , 北京航空航天大学

Inventor： 付培国 , 吴俊杰 , 赵志云 , 葛自发 , 赵忠华 , 孙立远 , 王禄恒 , 李欣 , 万欣欣 , 左源

IPC: G06Q10/06 , G06Q10/10 , G06Q50/00

Abstract: 本发明公开了一种舆情分析工作流系统，包括：数据分析功能模块，其包括N个能够进行舆情数据分析的数据分析模块；工作流建立模块，其根据舆情分析需求从数据分析功能模块中选择多个数据分析模块，按顺序进行连接，建立对特定任务进行分析的工作流，针对同一事件不同分析角度的舆情分析需求，建立多个工作流，以对多个舆情分析任务进行分析；工作流管理模块，其对建立的工作流进行数据分析计算，并通过可视化工作流图查看计算结果；事件管理模块，其对同一事件的多个舆情分析任务进行管理，并通过舆情分析数据构建不同任务之间的联系。本发明还提供了舆情分析工作流方法。本系统和方法能够根据舆情分析需求实现从不同层次和不同角度获得舆情信息。

39.

发明授权
一种基于知网的多义词中文实体关系识别方法有权

公开(公告)号：CN113239663B

公开(公告)日：2022-07-12

申请号：CN202110309085.1

申请日：2021-03-23

Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院信息工程研究所

Inventor： 赵忠华 , 余在洋 , 王禄恒 , 张磊 , 赵志云 , 王勇 , 葛自发 , 孙小宁 , 万欣欣 , 李欣 , 孙立远 , 付培国 , 王晴 , 杜宛真

IPC: G06F40/126 , G06F40/216 , G06F40/242 , G06F40/284 , G06F40/295 , G06F40/30 , G06N3/04 , G06N3/08

Abstract: 本发明公开了一种基于知网的多义词中文实体关系识别方法，其步骤包括：1)对中文网事数据中的每一条语料样本基于知网进行字颗粒度的向量化，得到每一个字对的字颗粒度向量；然后对每一字颗粒度向量所在的位置信息进行编码，得到语料中每个字与预标注的待识别实体关系对的相对位置编码；2)根据步骤1)所得结果生成每一语料样本的字颗粒度语义向量集合；3)基于知网生成每一语料的词颗粒度语义向量集合；4)利用各语义向量及其对应位置编码训练深度自注意力神经网络，得到深度自注意力神经网络编码器；5)生成待处理语料中字和词汇的语义向量及其对应位置编码输入深度自注意力神经网络编码器，得到该待处理语料中的实体关系。

40.

发明授权
一种人物属性抽取训练数据集构建方法失效

公开(公告)号：CN109033166B

公开(公告)日：2022-01-07

申请号：CN201810636331.2

申请日：2018-06-20

Applicant: 国家计算机网络与信息安全管理中心

Inventor： 赵忠华 , 孙小宁 , 李欣 , 万欣欣 , 袁钟怡 , 张小明

IPC: G06F40/211

Abstract: 本发明公开了一种人物属性抽取训练数据集构建方法。首先，下载HTML页面中的文本数据内容，提取描述人物正文内容和属性信息的信息框数据，并进行编码存储和语句切分；然后，对切分后的语句，选取既包含人物名称、人物属性值内容的语句构建人物属性抽取语料数据集；最后，提取人物属性抽取语料数据集中的所有动词，基于信息熵的方法对所有动词进行排序，提取排名靠前的动词作为属性触发词，把人物属性抽取语料数据集中不包含属性触发词的语句删除掉，剩下的语句就组成了人物属性抽取训练数据集。本发明综合利用的网页数据采集、词性分析、词语信息熵计算等技术自动构建人物属性抽取训练数据集，对提高训练数据集构建的效率具有重要意义。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification