一种基于答案感知的问题生成系统

    公开(公告)号:CN117195864A

    公开(公告)日:2023-12-08

    申请号:CN202311189875.6

    申请日:2023-09-14

    Inventor: 戴亮 朱新华

    Abstract: 本发明公开了一种基于答案感知的问题生成系统,属于自然语言处理技术领域,包括文本处理模块、答案识别模块、上下文感知模块、主题建模模块、问题生成模块、问题评估模块、答案验证模块、用户平台、用户反馈模块以及用户定制模块;本发明能够使得生成的问题更具上下文相关性,使其更好地与答案相匹配,提高了问题生成系统的性能,同时增加了生成的问题的多样性,使交互更有趣,有助于生成更相关和贴切的问题,且可以识别并提取多个答案,提高生成问题的质量和相关性。

    一种方面级情感分析的预训练语义组合细化方法

    公开(公告)号:CN116468049A

    公开(公告)日:2023-07-21

    申请号:CN202310463820.3

    申请日:2023-04-26

    Abstract: 本发明公开了一种方面级情感分析的预训练语义组合细化方法,涉及人工智能中的自然语言识别处理领域。首先,提出了一种改进的预训练语义全局细化方法,使用串行的多层逐点卷积对预训练语义进行全局细化。其次,在全局语义细化中,使用门机制将输出的池化向量与分类符的输出向量相结合,以产生更具表现力的情感分类向量。再者,在语义细化层中添加了三个不同窗口尺寸的并行卷积神经网络,进行多粒度局部语义细化,从而进一步加深模型对情感句子的理解。最后,将逐点卷积层数与并行卷积神经网络的窗口尺寸设置为动态超参数,采用联动测试的方式在不同语料中分别进行设置,从而使得模型在不同的语料中都有最佳表现。

    一种基于BERT的深度神经网络模型的自动评卷方法

    公开(公告)号:CN113935459A

    公开(公告)日:2022-01-14

    申请号:CN202111115698.8

    申请日:2021-09-23

    Abstract: 本发明公开了一种基于BERT的深度神经网络模型的自动评卷方法,在编码答案文本的微调BERT模型之上,构建一个语义细化层来细化BERT输出的语义,为BERT模型的隐藏状态提取相关的局部上下文。其次,引入一个多头注意力来融合从BERT输出中提取的全局上下文和局部上下文,作为学生答案和参考答案的句子对的最终表示。再者,本发明为简答题自动评卷提出了一种三重热点的策略,它将标准交叉熵损失函数中的计算标签从单独热点黄金分布改进为三重热点黄金分布。通过本发明实现端到端的简答题自动阅卷,以更有效的方法解决简答题自动评卷问题。

    基于实体特征的远程监督关系抽取方法

    公开(公告)号:CN113220844A

    公开(公告)日:2021-08-06

    申请号:CN202110569055.4

    申请日:2021-05-25

    Abstract: 本发明提供了一种基于实体特征的远程监督关系抽取方法,提出了实体引导增强特征网络,首先采用多级增强实体表示模块,在多头注意力机制下,设计实体引导注意力,从关键词和短语中提取关系特征。具体来说,实体对被视为查询序列,在多头注意力作用下,从目标句子中搜索最相关的单词和短语,其中,多级增强实体表示模块提取单词和短语层面的语义特征,并利用这些特征来增强头实体表示和尾实体表示;再将增强的两个实体表示拼接,输入到线性层中,以生成稳健的关系表示r,接下来,本发明使用语义融合层来整合多个语义表示,包括句子表示、两个增强实体表示和关系表示,生成最终健壮的句子向量。通过本发明可捕获可靠的关系特征,提高关系抽取效率。

    基于依存关系、词性和语义词典的类中心向量文本分类法

    公开(公告)号:CN108763402A

    公开(公告)日:2018-11-06

    申请号:CN201810496803.9

    申请日:2018-05-22

    Abstract: 本发明涉及自然语言处理中的文本分类,具体是一种基于依存关系、词性和语义词典的类中心向量文本分类法。针对基于统计学的特征选择算法的语义缺陷,本发明引入依存关系、语义词典、词性对文本特征进行优化与聚类,提出了改进的权重计算公式,进而提出了改进的类中心向量文本分类方法。本发明的文本分类法同时兼顾了传统类中心向量法的高分类效率与K最近邻算法的高分类精度二方面的优点,可广泛应用于各类分类系统中。

    一种基于依存关系的教学领域本体自动生成方法与装置

    公开(公告)号:CN108491385B

    公开(公告)日:2021-04-27

    申请号:CN201810219253.6

    申请日:2018-03-16

    Abstract: 本发明公开了一种基于依存关系的教学领域本体自动生成方法,首先通过TF_IDF权重从教材中抽取并自动生成领域术语表,并将其中的领域术语转换为教学领域本体中的概念,生成只有单层结构的初始教学领域本体,然后根据各类教学领域关系的特点,定义基于依存关系的描述本体关系的句子模板,形成描述本体关系的句子模板库,最后按步骤进行模板匹配、本体关系信息的提取与本体关系的自动生成。本发明所包括的装置有:领域术语表、句子模板库、句子预处理模块、模板推理机与本体关系生成器。本发明的优点是,模板不受句子结构物理位置影响,可扩展性强,教学领域本体自动生成的正确率高,可广泛应用于各学科智能教学系统中教学领域本体的自动构建。

    一种多入口医学问句模板装置及其方法

    公开(公告)号:CN110188170A

    公开(公告)日:2019-08-30

    申请号:CN201910450711.1

    申请日:2019-05-28

    Abstract: 本发明公开了一种多入口医学问句模板装置及其方法,所述模板装置是一种基于医学概念与医学关系的医学问句转换机构,它将主模板结构、近义模板结构、多入口联合结构中的推理规则与推理函数绑定在一起,实现将多种近义用户问句转换为一个多入口医学问句模板,以根据转换获得的多入口医学问句模板从UMLS医学知识库中抽取相应答案。本发明是为解决医学行业的智能信息检索与自动问答系统中,知识和关系较为复杂、一个问句语义需要通过多种语义关系给出解释的问题而设计的,同时也为提高模板设计效率、减少模板库的规模,以及最大限度地满足用户的提问意图。

    基于领域本体和模板逻辑的多语种问答接口快速构成方法

    公开(公告)号:CN104361127B

    公开(公告)日:2017-09-26

    申请号:CN201410735376.7

    申请日:2014-12-05

    Abstract: 基于领域本体和模板逻辑的多语种问答接口快速构成方法,包括:(1)多语种的领域本体结构的构建;(2)基于领域本体的一阶模板逻辑系统的建立;(3)基于领域本体与模板逻辑的多语种问句模板结构的设计;(4)面向领域的问句模板库的建立;(5)用户问句预处理与问句模板匹配;(6)用户问句的语义获取与多语种互译方法。本发明通过领域本体与模板逻辑可更加精确地表达问句模板的语义,结合模板运算符提高了问句模板的表达能力,使其更具代表性,可减少模板库的规模,并且多语种本体类似一个多语种的语义词典,易于实现跨语种信息查询。按照该方法可快速构成各类面向领域的智能信息检索与自动问答系统的多语种人机交互接口。

    一种基于BERT神经网络的慕课帖子分类方法

    公开(公告)号:CN118377902A

    公开(公告)日:2024-07-23

    申请号:CN202410558192.1

    申请日:2024-05-08

    Abstract: 本发明公开了一种基于BERT神经网络的慕课帖子分类方法,能够快速区分出慕课论坛中的紧急帖子和非紧急帖子,涉及人工智能与智慧教育的交叉领域。首先,使用BERT模型的输出作为动态词向量,使同一个单词在不同的慕课帖子的上下文中表示不同的语义,以便下游网络能更精确的提取出文本特征。其次,利用增强CNN和并行CNN对BERT的输出进行局部语义提取,再利用Bi‑GRU进行深度局部特征提取,生成局部分类向量;同时,利用双层逐点前馈网络和多头自注意力对BERT的输出进行全局语义细化,生成全局分类向量。最终,组合全局和局部分类向量,获得更具表现力的分类向量,提高紧急帖子分类的F1分数。

    一种基于案例四元组的法律判决预测对比学习方法

    公开(公告)号:CN118260426A

    公开(公告)日:2024-06-28

    申请号:CN202410449131.1

    申请日:2024-04-15

    Abstract: 本发明公开了一种基于案例四元组的法律判决预测对比学习方法,能够更有效地完成法律判决预测中法律条款、罪名指控和刑期预测三个子任务,涉及人工智能的自然语言识别处理技术在法律智能系统中的应用。对于每个原始判决样本,分别根据法律条款和罪名指控构建两个案例四元组,其中一个反例来自于与原始样本相同的章节,另一个反例来自不同的章节,使得模型可以同时学习同一章节和不同章节中案例事实的差异性,从而增强其泛化能力。此外,对于案例四元组对比学习的损失函数,提出了一种通过额外的关系约束来自适应确定损失阈值的方法。

Patent Agency Ranking