-
公开(公告)号:CN116775836A
公开(公告)日:2023-09-19
申请号:CN202310776007.1
申请日:2023-06-28
Applicant: 西安交通大学
IPC: G06F16/332 , G06F40/284 , G06F40/205 , G06N3/045 , G06N3/048 , G06N3/082
Abstract: 一种基于多层次注意力的教科书文本问答方法及系统,方法包括:将问题文本与对应章节的上下文段落进行分词并编码后输入第一层注意力模型,在句内进行自注意力计算与池化,得到句子的表征向量;取问题句子的表征向量与所有上下文段落句子的表征向量计算余弦相似度,每个段落仅保留相似度最大的一句话所对应的表征向量,作为每个段落对应问题的上下文表征向量;将问题及每个段落对应问题的上下文表征向量输入第二层注意力模型,进行段落与段落、段落与问题间的自注意力计算与池化,获得问题所对应的答案表征向量作为分类器的输入;由分类器输出答案选项,并得出答案文本对应章节的上下文段落。本发明可以针对教科书文本问题选择出更准确的回答选项。
-
公开(公告)号:CN112800214B
公开(公告)日:2023-04-18
申请号:CN202110128830.2
申请日:2021-01-29
Applicant: 西安交通大学
IPC: G06F16/34 , G06F40/289 , G06N3/08
Abstract: 本发明公开了一种基于主题共现网络和外部知识的主题识别方法,方法具体为:基于标注数据的主题共现网络构建:使用已有带主题标注的领域知识文本,检测文本中的主题子词并以此构建主题共现网络;融合外部知识和主题共现网络的开关模块构建:使用共现网络对带主题标注的领域知识文本进行信息丰富度排序,并以此排序结合外部知识构成开关模块;引入开关模块的改进领域知识文本主题识别模型自训练:使用自训练方法训练领域知识文本主题识别模型,尽可能使用无主题标注的领域知识文本的信息,防止自训练不加选择地学习无主题标注领域知识文本导致泛化性能下降;更充分更高效地利用有限语料信息,提升领域知识文本主题识别模型的性能。
-
公开(公告)号:CN113221882B
公开(公告)日:2022-12-09
申请号:CN202110512070.5
申请日:2021-05-11
Applicant: 西安交通大学
Abstract: 本发明公开了一种面向课程领域的图像文本聚合方法及系统,将对象特征及邻接矩阵作为输入构建图像对应的对象关系图,利用图卷积神经网络更新关系图中节点的特征;将所有语块特征向量的集合作为整个文本描述的特征表示;以对象特征集合和步语块特征集合作为输入,构建图文对之间的局部相似度矩阵;计算整个课程领域图像和文本描述之间的全局相似度;通过梯度下降法训练图文匹配模型的参数,通过已学习到的参数得出全局相似度最高的一段文本描述作为和该张图像相匹配的描述文本,实现图像文本聚合。本发明能够有效提取课程领域图像和文本描述的特征,从而将课程领域示意图和文本知识碎片聚合,进而自动化构建跨模态的知识碎片。
-
公开(公告)号:CN115424271A
公开(公告)日:2022-12-02
申请号:CN202211145293.3
申请日:2022-09-20
Applicant: 西安交通大学
Abstract: 本发明公开了一种基于自监督学习的示意图表征增强方法及系统,在图像和文本特征提取阶段,对示意图进行增广变换,识别出示意图中的文本框内容,对文本内容和示意图分别进行编码得到文本特征和图像特征;在文本指导下的示意图表征增强阶段,以文本特征为依据,应用指导注意力单元对图像特征进行增强;在对比自监督学习阶段,本发明通过投影函数将原图像和增广示意图增强特征映射至低维向量空间中,以低维向量计算损失并优化模型。
-
公开(公告)号:CN115393694A
公开(公告)日:2022-11-25
申请号:CN202211144391.5
申请日:2022-09-20
Applicant: 西安交通大学
Abstract: 本发明公开了一种基于多粒度文本推理的示意图目标检测方法及系统,将示意图的文本特征与图像特征融合得到经过文本特征增强的视觉特征;根据增强视觉特征提取视觉节点,根据示意图本身特征提取文本节点,将提取到示意图的文本节点与视觉节点作为图节点,根据文本节点与视觉节点的相对位置空间以及文本语义相似性构造边,细粒度融合文本特征与视觉特征,得到增强后的视觉节点特征,完成局部文本推理;提取全局文本关键词;使用文本节点和全局文本关键词之间的相似度筛选出有效的局部文本节点;将有效的局部文本节点、全局文本推理和局部文本推理进行多粒度融合,完成示意图目标检测。本发明有效提升了检测精度。
-
公开(公告)号:CN109165289B
公开(公告)日:2022-08-16
申请号:CN201811013087.0
申请日:2018-08-31
Applicant: 西安交通大学
IPC: G06F16/335 , G06F16/35
Abstract: 本发明提供一种通过深度卷积神经网络进行社区问答网站问题质量预测的方法:1)爬取社区问答网站中多门课程的问题网页数据集;2)抽取问题网页数据集中的问题社区特征、问题文本特征和提问者特征集合;3)基于问题社区特征定义多门课程的问题质量计算公式;4)将向量化表示的问题文本特征和提问者特征与问题质量计算公式一起作为深度卷积神经网络的输入,从而训练得到问题质量的分类标签。本发明构建深度卷积神经网络进行问题质量的预测,最终得到多门课程的高质量问题集合,方便用户学习和使用。
-
公开(公告)号:CN110866162A
公开(公告)日:2020-03-06
申请号:CN201910959395.0
申请日:2019-10-10
Applicant: 西安交通大学
IPC: G06F16/906 , G06K9/62 , G06Q50/20
Abstract: 本发明公开了一种基于MOOC数据中辍学行为的因果关系模型的建立方法,通过分析MOOC日志数据集和构建影响辍学行为的候选自变量,定性分析所述候选自变量与因变量之间的相关性;设计所述候选自变量与因变量之间依赖性的定量度量方法,来构建无向图,得到由自变量和因变量组成的节点集构成的无向图,使用基于互信息的局部因果网络结构发现算法,通过无向图中基于回归分析方程剔除错误变量和基于条件独立性测试生成局部网络,构建面向辍学行为的带方向的局部因果网络结构,对于任何一种目标学习效果变量,都可以通过无向图生成、错误节点剔除和局部网络结构构建来进行关于该学习效果的局部因果网络结构的构建工作,进行学习效果的因果关系挖掘。
-
公开(公告)号:CN110209814A
公开(公告)日:2019-09-06
申请号:CN201910435042.0
申请日:2019-05-23
Applicant: 西安交通大学
IPC: G06F16/35 , G06F16/951 , G06F17/27
Abstract: 本发明公开了一种利用领域建模从百科知识网站抽取知识主题的方法,首先从给定领域中提取出知识术语集并进行少量主题标注,然后通过向量化表示已标注知识术语的语义属性与拓扑特征构建训练样本集,并对二元分类器进行训练,从而得到主题特征分类模型,通过主题特征分类模型实现知识主题抽取。本发明可以实现从百科知识类网站高效且全面的抽取特定领域的知识主题。
-
公开(公告)号:CN105760514B
公开(公告)日:2018-12-07
申请号:CN201610101431.6
申请日:2016-02-24
Applicant: 西安交通大学
IPC: G06F17/30
Abstract: 本发明提供一种从社区问答网站自动获取知识领域短文本的方法,能够爬取社区问答网站知识领域相应领域下每个主题的问题网页和作者网页,获取数据全面系统,方便用户学习和使用。其包括如下步骤:步骤1,爬取社区问答网站中知识领域的Web页面;步骤2,抽取网页数据集中的知识领域短文本;步骤3,构建领域主题树;步骤4,领域主题树的存储。其能够从社区问答网站半结构化数据中自动抽取知识领域短文本,通过爬取社区问答网站知识领域相应领域下每个主题的问题网页和作者网页,构建了知识领域的网页数据集,然后自动抽取其中的知识领域短文本并发现其中的父子关系,从而构建了领域主题树并实现了领域主题树的存储,最终方便用户学习和使用。
-
公开(公告)号:CN108108430A
公开(公告)日:2018-06-01
申请号:CN201711368748.7
申请日:2017-12-18
Applicant: 西安交通大学
Abstract: 本发明公开了一种基于Unity3D知识森林虚拟现实系统实现的方法,包括获取数据;该数据包括多个知识领域主题,知识领域主题之间的认知关系,知识领域主题对应分面以及分面对应知识碎片;构建该知识领域主题分面树;通过层次布局算法生成每个知识领域主题的坐标数据;并且在该坐标数据上,通过数值微分法生成每条边上点的坐标数据;构建知识森林虚拟场景;定制虚拟显示控制器的交互。该方法突破了二维可视化技术在森林规模、布局和交互上存在的局限,同时给用户强烈的真实感,使用户更容易掌握。
-
-
-
-
-
-
-
-
-