-
公开(公告)号:CN119337864A
公开(公告)日:2025-01-21
申请号:CN202411298131.2
申请日:2024-09-18
Applicant: 北京理工大学东南信息技术研究院
IPC: G06F40/232 , G06F40/30 , G06F40/186
Abstract: 本申请提供一种融合用户语义和过往纠错记录的纠错大模型迭代训练方法,方法包括:纠错元数据构造:利用大模型指令数据集的构造方式,对篇章句子在内的数据进行纠错元数据的构造;输入为用户指定的待纠错文本;通过接受批改大模型的输出,调用动态反馈模块将批阅反馈发送给用户决策模块;用户决策模块接受输出结果,进行纠错意见和纠错结果的满意度反馈,并将用户的满意度反馈结果进行记录和重新组装,返回给动态反馈模块。本申请能够更准确地识别和纠正作文中的错误。
-
公开(公告)号:CN119311797A
公开(公告)日:2025-01-14
申请号:CN202411264441.2
申请日:2024-09-10
Applicant: 北京理工大学东南信息技术研究院
IPC: G06F16/332 , G06F16/33 , G06N5/04 , G06F18/2411 , G06F18/214
Abstract: 本申请提供一种基于情感信息的人格识别方法,方法包括:步骤一,对会话中的人格识别进行定义,将会话中的人格识别问题形式化为自然语言推理I问题;步骤二,构建情感对话内容;步骤三,构建人格描述;整理并总结每个人格特质的积极和消极描述,描述用于在NLI问题中作为假设,提供关于行为特征和情感表达倾向的详细信息;步骤四,训练并推理自然语言推理。本申请提高了人机交互的互动质量和个性化体验。
-
公开(公告)号:CN113342953A
公开(公告)日:2021-09-03
申请号:CN202110675321.1
申请日:2021-06-18
Applicant: 北京理工大学东南信息技术研究院 , 中国科学院信息工程研究所
IPC: G06F16/332 , G06F16/33 , G06F40/289 , G06Q50/26
Abstract: 本发明适用于智能问答领域,提供了一种基于多模型集成的政务问答方法。本发明将实际政务问答的复杂场景分解为多个部分,集成多种特定用途的在不同数据集上微调的预训练语言模型,分别进行FAQ问答对匹配、阅读理解以及层级检索以获取答案和可解释性证据,之后使用无监督答案验证方法对得到的答案和可解释性证据进一步验证,从而充分利用不同模型进行答案信息互补,提高政务问答的质量。采取的阅读理解模型经过无监督检索后能够快速推理并且层级检索方法非常高效,从而保证政务问答的实时性要求。多模型集成的使用能够进一步提高问答准确率,同时提供答案对应的可解释性证据。此外,无监督方法的特性使得该发明能够轻易移植到其他实际问答场景中。
-
公开(公告)号:CN113657095B
公开(公告)日:2024-08-23
申请号:CN202110966806.6
申请日:2021-08-23
Applicant: 北京理工大学
IPC: G06F40/211 , G06F18/2415 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及自然语言处理和深度学习技术领域,特别涉及一种关系抽取系统,包括接收模块、词向量序列生成模块和关系抽取模型,其中,接收模块,用于接收句包和目标实体对(eh,et);词向量序列生成模块,用于对句包中每个句子的词语进行位置和符号的结合嵌入,将句子转化为词向量序列;关系抽取模型,用于预测句包中所包含的关系集合。本发明提供的关系抽取系统能够有效地捕捉关系模式的信息,生成模式捕捉矩阵,使GPT模型能够有捕捉局部依赖的能力,进而提升关系抽取的效率和准确率。
-
公开(公告)号:CN116246279A
公开(公告)日:2023-06-09
申请号:CN202211691723.1
申请日:2022-12-28
Applicant: 北京理工大学
Abstract: 本发明涉及一种基于CLIP背景知识的图文特征融合方法,属于图文融合信息处理与应用技术领域。首先利用OCR图片文本识别模型,对数据集中的每张图片进行文本提取,并将其添加至输入中。对输入分别使用不同的预训练模型得到向量表示。将各个隐向量串联,然后经过两个Transformer编码器,计算不同模态向量间的关系。之后使用CLIP模型,分别抽取图片和文本的向量,得到富有知识的多模态融合特征。将多模态融合特征串联后输入到全连接层,使用softmax函数进行归一化,由此在CLIP语境下得到了图文的融合特征,完成基于CLIP背景知识的多模态特征融合。本发明丰富了图片和文本之间的联系,使用OCR增强了图片模态在文本模态上的关系,提升了多模态融合特征的表示程度。
-
公开(公告)号:CN113157859B
公开(公告)日:2023-04-18
申请号:CN202110367116.9
申请日:2021-04-06
Applicant: 北京理工大学
IPC: G06F16/33 , G06F16/35 , G06F40/211 , G06F40/216 , G06F40/30 , G06F18/241 , G06N3/0442 , G06F3/048 , G06N3/08
Abstract: 本发明提出一种基于上位概念信息的事件检测方法,包括S1、输入的语句S,通过第一模型构建所述语句的上位概念信息向量表示Zs;S2、将所述语句S和所述向量表示Zs输入第二模型,获取所述语句的事件触发词和的事件类别。本发明充分考虑了现实中单个触发词可能触发多种不同事件类型的情况,利用不同事件类别之间存在的层次关联关系,并将这种关联关系当作额外的监督信息融入事件检测过程,为触发词的识别以及分类提供了辅助的决策,且不会引入额外的噪声信息,同时能够有效提升事件检测的效果。
-
公开(公告)号:CN115968177A
公开(公告)日:2023-04-14
申请号:CN202310061221.9
申请日:2023-01-19
Applicant: 北京理工大学
Abstract: 本发明涉及数据储存系统,更具体的说是一种医疗数据存储系统,其包括机柜,设置在机柜内的储存单元,机柜具有能够实现底部进风且顶部排风的风道Ⅰ,机柜的后端设有能够打开和闭合的柜门,机柜上设有能够向机柜外部提供消毒的消毒组件。采用靠近壁面的垂直风道快速散热,可以避免因机柜在狭小空间内堆积散热受影响。在机柜上设有能够向机柜外部提供消毒的消毒组件,以便于对设备操作前对双手或防护服进行消毒。
-
公开(公告)号:CN113836893A
公开(公告)日:2021-12-24
申请号:CN202111074789.1
申请日:2021-09-14
Applicant: 北京理工大学
IPC: G06F40/211 , G06F40/242 , G06F40/253 , G06F40/284 , G06N3/04 , G06N3/08
Abstract: 本发明提出了一种融入多个段落信息的抽取式机器阅读理解方法,属于自然语言处理中的阅读理解技术领域。所述融入多个段落信息的抽取式机器阅读理解方法依托的阅读理解系统包括段落评分器、段落阅读器和答案选择器,包括以下步骤:S1,段落评分器根据问题和段落的相关程度得出段落包含正确答案的可能性;S2,段落阅读器根据问题抽取出段落中最有可能的N个答案,并量化它们是正确答案的可能性;S3,答案选择器融合段落阅读器和段落评分器的结果,将答案和答案所在段落可能性相乘,得出整篇文章中最有可能的答案。所述方法摆脱了现有技术对输入长度的限制,可以帮助用户在科研论文上进行阅读理解,从而快速了解论文内容,紧跟领域内最新进展。
-
公开(公告)号:CN113239694A
公开(公告)日:2021-08-10
申请号:CN202110622945.7
申请日:2021-06-04
Applicant: 北京理工大学
IPC: G06F40/289 , G06F40/30 , G06F40/211 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明提出一种基于论元短语的论元角色识别方法,包括S1、输入的语句S和事件类型C,通过第一模型构建所述语句中每个论元的论元短语表示Spani和所述事件类型的向量表示Eevent;S2、将所述语句的论元短语表示Spani和所述事件类型的向量表示Eevent输入第二模型,获取所述语句中所有论元的角色类别。本发明充分考虑了在进行论元角色识别过程中单个单词的向量表示不具有很好的分类特征、没有利用短语信息等问题,利用事件论元的短语信息,从而有效地学习到论元的分类特征,进一步提升论元角色识别的效果。
-
公开(公告)号:CN108416058B
公开(公告)日:2020-10-09
申请号:CN201810237590.8
申请日:2018-03-22
Applicant: 北京理工大学
IPC: G06F16/36 , G06F40/284
Abstract: 本发明提出了一种基于Bi‑LSTM输入信息增强的关系抽取方法,属于计算机人工智能自然语言处理领域。通过应用不确定标签的策略标注数据集,应用冗余编码技术对每个单词进行字符级编码产生词形编码向量。词形编码向量与词嵌入向量拼接生成词向量用于捕捉词形与词义信息。通过应用输入信息增强的Bi‑LSTM作为模型编码层,将词向量输入编码层,输出编码向量。将编码向量输入解码层,得到解码向量。应用三个分层次的NN,从解码向量分别提取出实体标签、关系类型、实体编号信息。最后,计算梯度、更新权重,通过最大化目标函数训练模型。本发明方法提高了系统的鲁棒性,减少了非实体单词带来的干扰信息,有效提高了关系抽取的准确率和召回率。
-
-
-
-
-
-
-
-
-