-
公开(公告)号:CN105550987A
公开(公告)日:2016-05-04
申请号:CN201610046116.8
申请日:2016-01-22
Applicant: 华建宇通科技(北京)有限责任公司 , 北京理工大学
IPC: G06T3/20
CPC classification number: G06T3/20
Abstract: 本发明公开了一种用于盲文图形编辑中几何图形转换盲文点阵图形的方法及装置,属于基于计算机科学的图形处理与分析技术领域;它包括:确定所画几何图形的始末位置并计算该图形方程,将始末位置间背景格横坐标带入方程求纵坐标,得交点;相邻两交点纵坐标差值大于背景格宽度的,计算中间与多条横线的交点;相邻两交点纵坐标差值小于背景格宽度且不在一个背景格内的,计算与中间横线的交点;这样计算出与所有背景格的交点后,再计算相邻交点的中点,中点所在的方格为需要绘制的盲文点。对比现有技术,本发明有效的结合画图功能,将所画几何图形以一种所见即所得的方式进行呈现,方便用户判断和观察图形走向,解决之前画图中效率低、正确率低的问题。
-
公开(公告)号:CN105468780A
公开(公告)日:2016-04-06
申请号:CN201510958361.1
申请日:2015-12-18
Applicant: 北京理工大学
IPC: G06F17/30
CPC classification number: G06F17/30985 , G06F17/30864
Abstract: 本发明涉及一种微博文本中产品名实体的规范化方法及其装置,属于互联网数据处理与分析技术领域。本发明方法利用词向量方法进行词的表示,并采用向量的相似度度量词的语义相似度,将待规范化的实体和与其最相似的K个词进行知识库的匹配,对其所属的品牌名进行权重的计算;同时引入了微博用户的交互关系和局部上下文中出现的实体信息进行产品实体的规范化。对比现有技术,本发明有效的解决了微博文本中因文本短、上下文信息不足等造成的产品名实体歧义问题,提高了微博文本中产品名实体规范化的性能。
-
公开(公告)号:CN104239294A
公开(公告)日:2014-12-24
申请号:CN201410458322.0
申请日:2014-09-10
Applicant: 华建宇通科技(北京)有限责任公司 , 北京理工大学
IPC: G06F17/28
Abstract: 本发明公开了一种用于藏汉翻译系统的、对复杂藏语长句进行快速、准确切分的多策略藏语长句切分方法,它包括:接收藏语长句,对每一成分逐个判断,若成分为数字或特殊符号、逗号但无源文模式匹配成功且模式条件满足的逗号切分实例、单词但在特征词索引表中检索不到,或者检索到然而无源文模式匹配成功且模式条件满足的特征词切分实例,则继续判断下一成分,否则记录切分点,切分点之前成分作为切分子句送出,继续判断余下第一个成分。在判断各成分之前先要判断指针当前是否指向空,若是则将余下成分送出结束,否则读取指针当前指向的成分。
-
公开(公告)号:CN103942192A
公开(公告)日:2014-07-23
申请号:CN201310593728.5
申请日:2013-11-21
Applicant: 北京理工大学
Abstract: 本发明公开了一种双语最大名词组块分离-融合的翻译方法,属于计算机科学中的自然语言处理技术领域。在基于树的统计机器翻译模型的中引入了BMNCs分离-融合翻译的思想,把句子翻译转化为句子中所有双语最大名词组块的翻译和句子骨架的翻译。本方法降低了翻译难度和翻译时间,提升了翻译准确率,尤其适合在即时翻译中针对较长句子的翻译。
-
-
公开(公告)号:CN114328863B
公开(公告)日:2025-05-06
申请号:CN202111512377.1
申请日:2021-12-08
Applicant: 北京理工大学
IPC: G06F16/3329 , G06F16/38 , G06F40/30
Abstract: 本发明涉及一种基于高斯核函数的长文本检索方法及系统,属于信息检索技术领域。本方法利用预训练语言模型的语义建模能力计算长文本各段落与用户检索内容的语义相似度,作为用户点击相关性的伪标签,有效缓解了缺乏段落级别标注数据的问题。通过不同的高斯核函数,将伪标签映射为不同维度的相关性得分。利用线性层聚合长文本各段落得分来输出用户检索内容对于长文本整体的相关性得分,能够让不同语义相似度等级的段落为用户点击相关与否做出贡献,增强了语义相似度与用户点击相关性的关联程度,提升了长文本检索模型的准确率。
-
公开(公告)号:CN114398467B
公开(公告)日:2025-02-14
申请号:CN202111477094.8
申请日:2021-12-06
Applicant: 北京理工大学
IPC: G06F16/3329 , G06F40/211
Abstract: 本发明涉及一种基于元擦除的证据句自动抽取方法,属于自然语言处理中的机器阅读理解技术领域。本方法无需人工标注,通过在句子级别进行擦除,根据每句话对答案的贡献程度来进行证据句的选择,实现自动选择证据句,并能够根据提升效果的幅度来评估证据句的选择,从而使多选阅读理解数据集能够根据证据句来解释模型行为。对比现有技术,本方法能够在证据句抽取与标注方面节省大量的时间和人力,并且得到很好的效果。
-
公开(公告)号:CN114065781B
公开(公告)日:2024-09-03
申请号:CN202111303044.8
申请日:2021-11-05
Applicant: 北京理工大学
IPC: G06F40/58 , G06F40/279 , G06F16/28
Abstract: 本发明提出一种基于翻译机制的实体和关系联合抽取系统及其使用方法,该系统利用翻译机制的思想,又规避掉传统翻译机制对对称关系的处理问题;提出利用NA(无关系)关系来作为动态阈值对关系预测的正确和错误结果进行分界。实体标注部分使用四个0/1标注器,对头实体和尾实体独立标注,能够解决单实体重合的问题。对于每一组头尾实体,使用翻译机制的思想利用h+r≈t,用尾实体减去头实体得到关系的向量表示,进而与关系集合中所有关系的向量做相似度计算,利用“与NA关系的相似度”作为动态阈值,取相似度大于该关系的所有关系作为预测结果,这样解决了实体对重叠的问题。在公开数据集上的实验表明,该系统的方法能够达到良好的水平。
-
公开(公告)号:CN118445652A
公开(公告)日:2024-08-06
申请号:CN202410457265.8
申请日:2024-04-16
Applicant: 北京理工大学东南信息技术研究院
IPC: G06F18/2323 , G06F18/22 , G06N3/0895 , G06N3/0455 , G06F40/205 , G06F18/241
Abstract: 本发明设计一种长文本匹配任务的训练方法,属于自然语言处理、信息检索和深度学习技术领域,包括:S1,文档内容聚类;S2,文档多视图采样;S3,动态对比学习;S4,聚合推理。其中,步骤S1包括对文档进行预处理并分句,对句子依据相似度聚类;步骤S2依据S1所得聚类,利用多种方法进行采样获取文档的视图;步骤3依据S2中获取的视图,选取不同的视图进行训练,获取文档匹配模型;步骤S4基于S3中训练所得的匹配模型,获取待匹配文档对的多个视图的分数,聚合获取最终的匹配度分数。本发明能获取文档中多种潜在的匹配关系,帮助高效学习到文档中的多种匹配关系,进而通过聚合推理获取更为全面的评估分数,训练效率更高,可适用于多种模型。
-
公开(公告)号:CN113761876B
公开(公告)日:2024-07-19
申请号:CN202110966548.1
申请日:2021-08-23
Applicant: 北京理工大学
IPC: G06F40/211 , G06F40/30 , G06F18/2415 , G06F18/22 , G06N3/0464 , G06N3/09
Abstract: 本发明提出一种基于力引导图的关系抽取方法,包括:接收到句包和实体对;构建出包含语义信息的句向量,并将各个句向量通过注意力机制将其组成句包向量;通过构建关系图,并运用物理学中引力斥力的概念,计算出关系表示矩阵;将关系表示矩阵和句包向量做运算,并将结果用softmax方法进行预测,得到句包中包含各种关系的概率。本发明提供的关系抽取方法及系统能够有效处理全局级别的关系关联,并将其用引力和斥力的概念加以模拟和表示,能够显著减少关系预测时的潜在搜索空间,并提升关系抽取的效率和准确率。
-
-
-
-
-
-
-
-
-