-
公开(公告)号:CN113496120A
公开(公告)日:2021-10-12
申请号:CN202010194752.1
申请日:2020-03-19
IPC: G06F40/295 , G06K9/62
Abstract: 本发明提供一种领域实体抽取方法、计算机设备、计算机可读介质及处理器,用于构建一个能够对漏洞描述文本中的领域实体进行自动抽取的命名实体识别模型,其特征在于,包括如下步骤:步骤S1,构建领域实体库;步骤S2,构建外部字典;步骤S3,基于所述实体库以及所述外部字典对所述漏洞描述文本进行实体匹配从而抽取出每个所述漏洞描述文本中的所有领域实体;步骤S4,使用词性标注工具标注出每个所述漏洞描述文本中各个文本单词的词性;步骤S5,将所述漏洞描述文本、对应的所述领域实体以及所述文本单词的词性构建为训练用数据集并训练出命名实体识别模型。
-
公开(公告)号:CN107844482A
公开(公告)日:2018-03-27
申请号:CN201610826714.7
申请日:2016-09-17
Applicant: 复旦大学
Inventor: 杨卫东
CPC classification number: G06F17/30734 , G06F17/274 , G06F17/2785 , G06F17/30604 , G06F17/30684 , G06F17/30923 , G06F17/30929 , G06K9/6215
Abstract: 本发明属于数据源模式匹配领域,涉及一种基于全局本体的多数据源模式匹配方法,包括,将待匹配的多个模式转换成统一的数据模型—模式本体;根据多种模式匹配的相关算法,将各个转换后的模式本体分别与全局本体进行模式匹配,联合多个匹配算法的计算结果,分别得到各个模式本体与全局本体中的元素间的相似关系,使用相似度矩阵表示;最后使用相似关系的聚合策略,根据相似关系的传递性,将上述得到的相似关系进行聚合,得到多个数据源模式两两之间的匹配结果。本发明可解决企业内部或者企业之间的多个数据源模式之间需要进行两两模式匹配的问题,能明显提高多数据源模式匹配的质量和效率,且有较好的扩展性。
-
公开(公告)号:CN101615190A
公开(公告)日:2009-12-30
申请号:CN200910055812.5
申请日:2009-07-31
Applicant: 复旦大学
IPC: G06F17/30
Abstract: 本发明属于可扩充标记语言(XML)关键字检索技术领域,具体为一种安全的XML关键字检索方法。本发明结合XML关键字搜索和XML安全控制,首次研究基于安全访问控制的XML关键字检索技术,包括:在XML关键字的最小最低公共祖先(SLCA)和基于视图的安全访问控制规则的基础上,确定基于安全访问控制规则的XML关键字检索结果(SSLCA);建立基于安全视图的关键字索引;以及在此基础上的关键字检索算法(SIL)。本发明方法实现了高效、安全的关键字检索。
-
公开(公告)号:CN118520118A
公开(公告)日:2024-08-20
申请号:CN202310127087.8
申请日:2023-02-17
Applicant: 复旦大学
IPC: G06F16/36 , G06F18/214 , G06F40/289 , G06F40/211
Abstract: 本发明提供了一种基于迁移学习的垂直领域知识图谱构建方法,具有这样的特征,包括以下步骤:步骤S1,知识文本输入预训练自然语言模型A得到词元;步骤S2,自然语言标签输入预训练自然语言模型B得到特征表示集;步骤S3,词元与特征表示集进行点积计算得到分类结果;步骤S4,现有关系词语填入Prompt模板后输入预训练自然语言模型C得到向量表示;步骤S5,分类后句子输入预训练自然语言模型D得到编码结果;步骤S6,编码结果和向量表示进行相似度计算得到关系分类结果;步骤S7,根据词元和关系分类结果构建元组从而构建知识图谱。总之,本方法对垂直领域的实体抽取有较好的效率和质量,并且在关系抽取上具有较好的可扩展性。
-
公开(公告)号:CN115115019A
公开(公告)日:2022-09-27
申请号:CN202110296482.X
申请日:2021-03-19
Inventor: 杨卫东
IPC: G06N3/04
Abstract: 本发明提供了一种基于神经网络的异常检测方法,用于对多维时序数据中的异常数据进行自动化检测,包括以下步骤:步骤1,根据多维时序数据的长短设置长、中、短三个时间窗口长度,将多维时序数据根据时间窗口长度划分为多个时间窗口数据并根据划分后时间窗口长度计算相关性矩阵作为对应时间窗口数据的信号矩阵;步骤2,通过卷积神经网络对信号矩阵的空间信息进行提取,并对信号矩阵进行编码;步骤3,通过卷积长短记忆神经网络对信号矩阵的时序信息进行提取,并添加到编码后的信号矩阵;步骤4,将编码后的信号矩阵通过卷积神经网络与卷积长短记忆神经网络进行解码得到还原矩阵,对还原矩阵与信号矩阵计算重建误差,并设定阈值进行异常数据判定。
-
公开(公告)号:CN115114379A
公开(公告)日:2022-09-27
申请号:CN202110295328.0
申请日:2021-03-19
Inventor: 杨卫东
IPC: G06F16/28 , G06F16/2458 , G06F40/284 , G06F40/253 , G06F40/295 , G06F40/30
Abstract: 本发明提供了一种关系型数据库的实体间关系提取方法,用于从关系型数据库中自动构建RDF,包括以下步骤:步骤1,从关系型数据库中提取数据库关系模式特征,包括属性名称语法相近度特征、属性名称词集相近度特征、数据类型匹配特征和数据库关系特征;步骤2,构建关系型数据库中的交集特征与内容实例特征;步骤3,从已有IND的数据库中构建各特征,使用随机森林算法对各特征进行有监督的学习来训练相应的实体关系发现模型,获得各特征对新数据集进行处理时所占的权重;步骤4,通过实体关系发现模型分辨出关系型数据库中所有成立的IND(a1,a2)并自动生成数据库关系图;步骤5,根据数据库关系图依据预定转换规则进行实体间关系转换得到RDF。
-
公开(公告)号:CN114756535A
公开(公告)日:2022-07-15
申请号:CN202210331227.9
申请日:2022-03-31
IPC: G06F16/215 , G06F16/2458 , G06F17/16 , G06T5/00 , G06N7/00
Abstract: 本发明提供一种基于复杂噪声的贝叶斯张量补全算法,针对具有缺失值以及复杂噪声的目标数据,通过将目标数据表示为张量,该张量为张量估计值和噪声的和,并采用CP分解提取张量的低秩信息,结合CP分解、贝叶斯方法的框架进行吉布斯抽样,通过迭代得到张量估计值,进而基于张量估计值对目标数据同时进行补全和去噪。由于采用CP分解充分挖掘张量的低秩信息,且充分利用了已观测的张量信息,并进行了迭代抽样,因此该补全算法对异常值以及复杂噪声也能够实现很好的补全及去噪,是一种鲁棒有效的张量补全算法,相比于现有技术中的补全方法,本发明的补全算法能够获得更为精确的张量估计值,从而实现更为精确的目标数据补全及去噪。
-
公开(公告)号:CN113887694A
公开(公告)日:2022-01-04
申请号:CN202010629307.3
申请日:2020-07-01
Abstract: 为了根据待测对象的对象特征完成点击率预估,可作为数据精排环节应用于企业级推荐系统、搜索系统和在线广告系统等领域。本发明提供一种注意力机制下基于特征表征的点击率预估模型,该模型包括:特征嵌入层,用于将连续型特征和离散型特征进行矢量化处理进而形成堆叠特征、显式特征交叉网络,通过注意力交叉网络将堆叠特征进行显式特征组合、隐式特征交叉网络,通过多层感知机将堆叠特征进行隐式特征组合以及预估概率输出层,根据接收到的组合特征对点击率进行预估。其中,注意力交叉网络消除了预估模型对人工特征工程的依赖,同时注意力机制的引入,区分了各组合特征对模型预估的重要性,消除了无用、冗余特征对模型的影响。
-
公开(公告)号:CN109741097A
公开(公告)日:2019-05-10
申请号:CN201811597793.4
申请日:2018-12-26
Applicant: 复旦大学
IPC: G06Q30/02
Abstract: 本发明属于价格计算技术领域,具体为一种基于产品服务周期的自适应价格计算方法。本发明针对航材备件的特点,提出了价格自适应方法,这是综合定价方法,具体包括ABC分析、决定价格范围、强制执行业务规则、选择商业化策略、使用分析来支持定价决策和选择定价工具六个步骤。本发明能够有效地在历史数据上分析出最优定价方案;可应用于航空航天材料、医疗仪器材料、贵重仪器材料定价策略的制定等各个领域。
-
公开(公告)号:CN102043802B
公开(公告)日:2013-09-25
申请号:CN200910197333.7
申请日:2009-10-16
Applicant: 上海飞机制造有限公司 , 复旦大学
IPC: G06F17/30
Abstract: 本发明提供了一种XML关键字检索方法,包括以下步骤:a.对一个XML树进行深度优先遍历,建立所述XML树的结构摘要树,并对所述结构摘要树的所有节点以及所述XML树的所有叶子节点分别进行编码,以得到各个叶子节点的编码和各个结构摘要树节点的编码;b.对所述各个叶子节点以及各个结构摘要树节点,以其各自的节点名称或文本值为键,以其各自的编码为值,建立倒排索引;c.由所述结构摘要树中计算出最小最低公共祖先节点;d.基于计算出的最小最低公共祖先节点,构造出检索返回结果。
-
-
-
-
-
-
-
-
-