基于结构分析的可扩展标记语言键约束验证方法

    公开(公告)号:CN1704932A

    公开(公告)日:2005-12-07

    申请号:CN200410042943.7

    申请日:2004-06-01

    Applicant: 北京大学

    Abstract: 本发明公开了一种基于结构分析的可扩展标记语言键约束验证方法,包括根据输入的待验证的XML文档和该文档需遵从的键约束,抽取XML文档中的键值生成键值文档;根据预设计的键值文档DTD,检查键值文档是否满足键值文档DTD的结构约束,如果满足,则待验证的XML文档满足定义的键约束;否则该待验证的XML文档不满足键约束。本发明可广泛应用于当前网络环境下各应用系统的基于XML的数据交换过程,满足了Internet上各应用系统之间基于XML数据交换的需求,具有广阔的应用前景。

    面向可扩展标记语言模式的键约束自动生成方法

    公开(公告)号:CN1560766A

    公开(公告)日:2005-01-05

    申请号:CN200410004379.X

    申请日:2004-02-17

    Applicant: 北京大学

    Abstract: 本发明提供了一种基于关系数据库模式图Schema Diagram生成可扩展标记语言大纲XML Schema的层次描述和键约束的方法,包括:利用关系数据库的键和外键构造数据库的模式图;在扫描模式图过程中建立关系表名、候选码与XML Schema中键约束的选择器XPath(Selector XPath)、域XPath(Field XPath)之间的对应关系,生成关系数据库键约束的XML选择器索引;利用该索引自动生成XML Schema上的键约束,从而完成基于XML数据发布过程中键约束的自动获得。本发明广泛应用于当前网络环境下各应用系统的基于XML的数据发布过程,满足了目前Internet上大量应用系统之间XML数据发布与转换的需求,具有广阔的应用前景。

    基于方面语义增强的文本情感分类方法及系统

    公开(公告)号:CN117112790A

    公开(公告)日:2023-11-24

    申请号:CN202311123144.1

    申请日:2023-09-01

    Abstract: 本发明提出了一种基于方面语义增强的文本情感分类方法及系统,属于信息技术领域,针对低资源环境方面语义学习不充分的情况,首先从社交媒体采集文本数据,利用元学习设置构建元测试任务和元训练任务。通过大规模语言模型从数据集中提取特征向量,然后构建原型并计算查询样本的语义增强对比损失。利用多头注意力机制生成情感特征向量,并构建交叉熵损失函数。结合两个损失函数进行模型训练,最后预测目标方面的情感极性。本发明在元学习范式中增强方面语义感知能力,提高小样本文本情感分类的准确率,提升目标方面的情感极性判定效果。

    一种基于动态社区挖掘进行专家检索的方法

    公开(公告)号:CN103488637B

    公开(公告)日:2016-12-14

    申请号:CN201210191968.8

    申请日:2012-06-11

    Applicant: 北京大学

    Abstract: 本发明提供一种基于动态社区挖掘进行专家检索的方法,针对动态网络环境,同时利用链接结构和内容信息挖掘社区,将链接结构和内容表达为矩阵形式,综合历史社区划分结果,使用非负矩阵分解方法进行社区划分,并对社区划分代价进行迭代处理,使其结果局部最优化,以使社区结果在反映网络的链接特征的同时,还反映话题、兴趣等语义层面的特征,通过利用社区划分结果和社区话题,进行专家搜索,从而实现不同时刻的专家检索。本发明的方法不仅能反映社区成员、规模的变化,还能反映社区的话题分布及其随时间的变化,从而可以将社区挖掘结果直接专家搜索。

    一种结果缓存替换的优化方法

    公开(公告)号:CN103488638B

    公开(公告)日:2016-12-07

    申请号:CN201210191976.2

    申请日:2012-06-11

    Applicant: 北京大学

    Abstract: 本发明公开了一种结果缓存替换的优化方法,属于计算机网络技术领域。本方法为:1)以系统搜索日志中的用户ID为键、用户发起的请求为键值建立一哈希表h2;2)将同一用户ID发起的所有请求进行拼接,得到一字符串,对所有用户的拼接字符串构成的文档集进行话题模型分析,获得话题集合M及关联度;3)计算与某话题相关的搜索请求出现次数与同一时间段内所有请求出现次数的比值,计算该请求的权重贡献值;4)当收到一请求q时,查找匹配的结果缓存并返回和更新h2;如果没有,则在h2中查找对应的键值并与q拼接,计算q的权重贡献值;5)将结果缓存中权重较低的结果项替换出去,并加入新的缓存项。本发明可大大提高缓存命中率的效果。

    一种支持含有缺失符号的查询请求的全文检索方法

    公开(公告)号:CN102722527B

    公开(公告)日:2014-08-06

    申请号:CN201210153267.5

    申请日:2012-05-16

    Applicant: 北京大学

    Abstract: 本发明提供一种支持含有缺失符号的查询请求的全文检索方法,其步骤包括:将文本内容符号化为符号串,并拼接为一个长符号串;对长符号串分别执行BWT转换、[l,m]-skipping-BWT转换、w-ahead-BWT转换以及SET-skipping,w-ahead-BWT转换;基于四种转换的结果构建小波树,并建立C表和FT数组,构成符号轮转索引;对给定的查询请求进行全文匹配,并输出检索结果,所述查询请求可以含有一段或多段连续缺失符号。本发明支持不同的符号化方法,支持含有缺失符号的查询请求,能够满足不同类型的检索需求。

    Web社会网络核心用户信息交互演化分析方法

    公开(公告)号:CN102637182B

    公开(公告)日:2014-05-28

    申请号:CN201110038103.3

    申请日:2011-02-15

    Applicant: 北京大学

    Abstract: 本发明公开了一种Web社会网络核心用户信息交互演化分析方法,包括:1)从Web社会网络应用程序获取用户互动信息数据;2)确定核心用户节点;3)根据获取的数据通过增量计算方法建立Web社会应用网络图结构;4)计算所有图结构中核心节点与其他节点之间的hop距离;5)获取到核心节点的hop距离在阈值内的所有节点,根据节点间的hop距离,将阈值内的节点划分为不同群落;6)根据每个群落的权值,计算出当前时间点与核心节点信息交互最密集的群落;7)预测下一时间点与核心节点信息交互的群落。本发明从核心用户节点入手获得信息在不同节点和群落间的传播规律,并通过增量计算使普通计算机也能进行本发明的图结构分析。

Patent Agency Ranking