Patent search ap:("中国科学院计算技术研究所") AND inv:"程学旗" Page 1

1.

发明授权
流式图中的洗钱行为检测方法、装置、介质有权

公开(公告)号：CN114581230B

公开(公告)日：2025-04-04

申请号：CN202210044130.X

申请日：2022-01-14

Applicant: 中国科学院计算技术研究所

Inventor： 刘盛华 , 程学旗 , 孙晓冰 , 冯文杰 , 沈华伟

IPC: G06Q40/04 , G06Q20/40 , G06N20/00 , G06F16/901

Abstract: 本发明提出一种流式图中的洗钱行为检测方法、装置、介质，所述方法包括获取洗钱场景中的资金交易信息作为图数据通过有向图表示；在每一条所述资金流到达时，判断所述发生源账户是否在转出资金后达到资金平衡状态，且所述目标账户是否在转入资金后到达资金平衡状态；分别统计当前时刻时所述发生源账户与目标账户达到资金平衡状态的次数以及从初始时刻到当前时刻最近一次达到资金平衡状态之间累积的资金有效转入次数，作为统计特征输入至异常账户评估模型进行异常评估。该方法能够快速并且准确地检测出不同模式的洗钱行为，并且找到可疑的洗钱账户。

2.

发明授权
文本内容的衍生方法、装置、计算机可读介质及电子设备有权

公开(公告)号：CN113569539B

公开(公告)日：2025-04-04

申请号：CN202110164573.8

申请日：2021-02-05

Applicant: 中国科学院计算技术研究所 , 腾讯科技(深圳)有限公司

Inventor： 庞亮 , 郝长盈 , 王琰 , 兰艳艳 , 沈华伟 , 史树明 , 程学旗

IPC: G06F40/166 , G06F40/279

Abstract: 本申请的实施例提供了一种文本内容的衍生方法、装置、计算机可读介质及电子设备。该文本内容的衍生方法包括：获取原始文本内容，基于原始文本内容以及与原始条件相对应的反事实条件，从原始结尾中识别出与原始条件相关的因果内容；基于原始结尾以及原始结尾中的因果内容，确定表示原始结尾的文本架构的结尾框架；基于前提、反事实条件以及结尾框架构成的序列，生成原始结尾对应的反事实结尾；本实施例中生成的反事实结尾在原始结尾的基础上，基于原始文本内容中的因果内容生成，在因果内容与原始文本内容一致性的前提下，使得生成的反事实结尾更加符合因果逻辑，增加表达的流畅性。

3.

发明公开
一种推荐系统评论区的群体极化问题检测方法和装置审中-实审

公开(公告)号：CN119089890A

公开(公告)日：2024-12-06

申请号：CN202410585948.1

申请日：2024-05-13

Applicant: 中国科学院计算技术研究所

Inventor： 尹芷仪 , 张浩 , 冯浩源 , 程学旗 , 沈华伟 , 王晓诗 , 景少玲

IPC: G06F40/20 , G06F16/35 , G06F40/284 , G06F16/36 , G06Q50/00 , G06N20/00

Abstract: 本发明提出一种推荐系统评论区的群体极化问题检测方法和装置，包括：对推荐系统指定的评论主帖进行话题观点提取，得到主帖观点；对评论主帖的评论区进行立场检测，得到评论区各条评论相对主帖观点的立场类别；通过提取各条评论的关键词，得到各条评论的立场类别对应的强烈程度；按照评论时间将评论区的评论排序，统计评论初始时间段内各立场类别的评论数量，并根据初始时间段内各条评论的强烈程度，得到各立场类别的平均极化程度，作为基准；持续抽取与初始时间段相同长度但时间靠后的后续时间段，计算后续时间段各立场类别的平均极化程度，并与基准进行对比，得到立场的极化偏离程度，当极化偏离程度超出阈值时进行报警。

4.

发明公开
一种基于语义的开放域网页知识抽取方法及系统审中-实审

公开(公告)号：CN117131189A

公开(公告)日：2023-11-28

申请号：CN202310294820.5

申请日：2023-03-23

Applicant: 中国科学院计算技术研究所

Inventor： 郭岩 , 王之威 , 刘悦 , 沈华伟 , 程学旗

IPC: G06F16/35 , G06F16/31 , G06F16/332 , G06F40/35 , G06N3/0499 , G06N3/08

Abstract: 本发明提出一种基于语义的开放域网页知识抽取方法，包括：获取开放域网页的骨架树，对该骨架树的骨架节点进行分裂，得到该骨架节点的骨架子节点，生成骨架子节点序列；对该骨架子节点和该骨架节点标注分类标签，根据该分类标签对该骨架树进行关系抽取，获得抽取任务的关系子节点序列，并生成关系片段；基于该关系片段对该骨架树进行客体抽取，以抽取到的骨架子节点序列为客体片段；以该关系片段和其对应的客体片段为该抽取任务的抽取结果。本发明还提出一种基于语义的开放域网页知识抽取系统，以及一种用于开放域网页知识抽取的数据处理装置。

5.

发明授权
一种基于关联融合的环境监测数据补全方法及系统有权

公开(公告)号：CN113392139B

公开(公告)日：2023-10-20

申请号：CN202110624648.6

申请日：2021-06-04

Applicant: 中国科学院计算技术研究所

Inventor： 刘财政 , 刘盛华 , 沈华伟 , 程学旗

IPC: G06F16/2458 , G06F16/901 , G06N3/0442 , G06N3/045 , G06N3/08

Abstract: 本发明提出一种基于关联融合的环境监测数据补全方法和系统，包括：获取数据存在缺失的环境监测数据及其对应的标记矩阵；根据环境监测数据中每个时间点的各个属性，得到属性间的关联系数，以构建图G，图G中节点对应属性，节点间的边对应属性间的属性关联系数；通过将图G和待补全矩阵按位相乘，得到中间矩阵，通过神经网络对中间矩阵进行时序处理，得到环境监测数据中各时间点的隐藏状态；根据各时间点的隐藏状态，计算环境监测数据的时间关联性系数；通过将时间关联性系数和各时间点的隐藏状态按位相乘，得到环境监测数据中各时间点的中间状态；在环境监测数据中，对中间状态采用生成式的非线性变换，得到环境监测数据的重构补全数据。

6.

发明授权
基于多平台的网络事件流行度预测方法与系统有权

公开(公告)号：CN113190733B

公开(公告)日：2023-09-12

申请号：CN202110459851.2

申请日：2021-04-27

Applicant: 中国科学院计算技术研究所

Inventor： 程学旗 , 匡广生 , 郭岩 , 刘悦 , 陈银鹏 , 付宏宇 , 俞晓明

IPC: G06F16/951 , G06N3/0464 , G06N3/0442 , G06N3/08

Abstract: 本发明公开一种基于多平台的网络事件流行度预测方法，包括以下步骤：分别获取多个平台的网络事件的流行度预测序列，并融合多个流行度预测序列形成网络事件的流行度联合预测序列；分别获取多个平台的网络事件的流行度历史序列，并融合多个流行度历史序列形成网络事件的流行度联合历史序列；利用生成式对抗网络将流行度联合预测序列与流行度联合历史序列进行对齐，得到网络事件的流行度最终预测序列。

7.

发明公开
基于标签序列一致性建模的事件论元检测方法及系统审中-实审

公开(公告)号：CN116595407A

公开(公告)日：2023-08-15

申请号：CN202310388963.2

申请日：2023-04-12

Applicant: 中国科学院计算技术研究所

Inventor： 郭嘉丰 , 靳小龙 , 程学旗 , 官赛萍 , 张付俊 , 席鹏弼

IPC: G06F18/24 , G06F18/214 , G06F18/25 , G06F40/289 , G06N3/0455 , G06N3/08

Abstract: 本发明提出一种基于标签序列一致性建模的事件论元检测方法及系统。主要包括词序列语义编码、词标签序列标注、易错标签序列生成、对比学习正则化。词序列语义编码对预处理后的词采用BERT与训练语言模型进行语义表示学习，并将事件类型信息融入表示向量中；词标签序列标注使用全连接网络来对每个词对应的标签概率分布做出预估；易错标签序列生成则是根据一定策略按照词标签序列概率分布生成易错标签序列；对比学习正则化则是基于易错标签序列和正确标签序列的对比学习构建正则化损失，提高词序列标签的一致性。

8.

发明授权
一种网站列表页面的分类方法、系统及存储介质有权

公开(公告)号：CN112287272B

公开(公告)日：2023-05-23

申请号：CN202011161424.8

申请日：2020-10-27

Applicant: 中国科学院计算技术研究所

Inventor： 孟剑 , 郭岩 , 贺广福 , 史存会 , 陈银鹏 , 俞晓明 , 刘悦 , 程学旗

IPC: G06F16/958 , G06F16/35 , G06F16/957 , G06N3/0464 , G06N3/08

Abstract: 本发明涉及一种网站列表页面的分类方法，所述分类方法基于超文本标记语言标签(HTML Tag)，所述分类方法包括：步骤100、获取一组网站网页；步骤200、分别针对每一所述网站网页提取所述网站网页的统计特征和结构特征，得到每一所述网站网页对应的特征序列；步骤300、将所述特征序列输入神经网络进行所述神经网络的训练，得到网站列表页面分类器；步骤400、获取待分类的网站网页，根据所述步骤200得到所述待分类的网站网页的特征序列，将所述待分类的网站网页的特征序列输入所述步骤300得到的所述网站列表页面分类器，判断该待分类的网站网页是否为网站列表页面。

9.

发明公开
基于三元组森林的实体关系联合抽取方法及系统审中-实审

公开(公告)号：CN115687638A

公开(公告)日：2023-02-03

申请号：CN202211199819.6

申请日：2022-09-29

Applicant: 中国科学院计算技术研究所

Inventor： 程学旗 , 靳小龙 , 郭嘉丰 , 王炫力 , 席鹏弼 , 廖华明

IPC: G06F16/36 , G06F40/211 , G06F40/289 , G06N3/0455 , G06N3/044 , G06N3/048 , G06N3/047 , G06N3/08

Abstract: 本发明提出一种基于三元组森林的实体关系联合抽取方法和系统，包括：获取待实体关系抽取的语料，得到句子及其对应的词序列；将词序列输入BERT模型，BERT模型对词序列进行分词，得到子词序列，使用BERT模型对子词序列进行编码，得到句子的分布式表示；将分布式表示输入CRF模型，标注句子中实体，得到实体的向量表示；将实体向量输入，通过TransformerDecoder模块中多头注意力机制获得实体向量中包含的实体间交互信息、实体和输入句子间交互信息的隐层向量；将隐层向量作为Tree‑RNN的初始状态和初始隐层单元，输入实体表示至Tree‑RNN，从Tree‑RNN的根节点的头实体生成其所参与的关系，根据头实体及其对应的关系，选择其尾实体，从而生成重叠的三元组树，再进一步解码得到实体关系三元组。

10.

发明授权
一种构建文本分类系统的方法、系统、介质及电子设备有权

公开(公告)号：CN111966826B

公开(公告)日：2023-01-24

申请号：CN202010709070.X

申请日：2020-07-22

Applicant: 中国科学院计算技术研究所

Inventor： 范意兴 , 郭嘉丰 , 袁浩达 , 张儒清 , 程学旗

IPC: G06F16/35 , G06F40/289 , G06F40/30 , G06F40/216 , G06F18/2415

Abstract: 本发明实施例提供了种构建文本分类系统的方法、系统、介质及电子设备，该文本分类系统包括分句模块、句子级特征提取模块、篇章级特征提取模块和分类模块，该方法包括：A1、获取包括多个文本的训练集，所述训练集中的文本带有标记的所属类别，且其中至少部分文本是超长文本；A2、用分句模块根据预定义的分句规则对训练集中的每个文本进行分句以得到多个句子；A3、用所述训练集对文本分类系统的句子级特征提取模块、篇章级特征提取模块和分类模块进行多轮训练至收敛，得到文本分类系统；本发明减少了提取特征时丢失语义信息和结构信息的可能，最后根据文本的篇章特征用于后续的分类预测，提高了文本分类的准确率，尤其适用于对超长文本的准确分类。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification