一种题目文本句子向量生成方法及装置

    公开(公告)号:CN109960804B

    公开(公告)日:2023-05-02

    申请号:CN201910215490.X

    申请日:2019-03-21

    发明人: 梅阳阳 郑文娟

    摘要: 一种题目文本句子向量生成方法,包括步骤:S1.根据题目文本表达筛选出所有关键词,加入词典,再对题目文本中的句子进行词典分词,同时对句子中出现的关键词进行标记;S2.基于分词结果和筛选出的所有关键词,通过分别对每条句子和其内包含的关键词编码后,再建立RNN模型采用随机剔除关键词的方法进行预测训练;S3.利用训练好的模型提取到的特征,对题目文本中的每条句子生成句子向量。

    多维度混合OCR识别方法、装置、设备及存储介质

    公开(公告)号:CN113537201A

    公开(公告)日:2021-10-22

    申请号:CN202111084304.7

    申请日:2021-09-16

    发明人: 马百泉

    摘要: 本发明提供了一种多维度混合OCR识别方法、装置、设备及存储介质,该方法包括:将图像设置为预设尺寸;根据预设神经网络模型区分所述图像的公式、图表和/或文字区域,并分别获取所述公式、图表和/或文字区域的位置坐标;根据所述公式、图表和/或文字区域分别调用不同的OCR模型进行识别,以获取识别结果;根据所述位置坐标和识别结果输出所述图像的识别信息。通过上述方案,实现了公式、图表及文字混合图像的直接OCR识别,提高了识别的准确度,具有较强的鲁棒性,解决了现有技术中存在的难以进行简便、准确的公式、图表及文字混合的图像的识别的问题。

    一种用于教育资源库的公式处理方法及系统

    公开(公告)号:CN113326675A

    公开(公告)日:2021-08-31

    申请号:CN202110889179.0

    申请日:2021-08-04

    发明人: 郑文娟

    摘要: 本发明涉及一种用于教育资源库的公式处理方法及系统,所述方法包括以下步骤:公式的识别;将识别的公式转化为Latex表达式,将Latex格式转化为高分辨率且背景为透明的图片;构造编辑器,所述构造编辑器基于Latex表达式在线实时编辑;在线编辑纠错提示;编辑完成后,按接收的风格样式要求,返回图片,并保存编辑后的Latex格式;在需要导出Word文档时,将选取题目中公式的Latex格式转化为Office Word中自带编辑器所需格式或Mathtype编辑器所需格式。本发明通过实现对录入公式的在线编辑及实时渲染,便利了入库题目的在线更改,增加题库建设的效率;渲染效果可以自定义设置,且分辨率高,大大增加了用户体验,也提高了公式应用效果。

    一种数学题目知识点和解题方法的自动提取方法、装置、平台

    公开(公告)号:CN109918514A

    公开(公告)日:2019-06-21

    申请号:CN201910215483.X

    申请日:2019-03-21

    发明人: 张阳 郑文娟 陈怡

    IPC分类号: G06F16/36

    摘要: 一种数学题目知识点和解题方法的自动提取方法,包括以下步骤:S1,对数学题目文本进行自然语言理解处理,处理结果作为初始数据集;S2,结合drools推理引擎和符号计算系统,使用自动推理训练初始数据集,得到规则集;S3,根据规则集中规则与各知识点、解题方法的映射,提取出每道数学题目中包含的知识点和解题方法。该方法可用于为学生提供精准的题目推荐,也可以方便老师了解学生未掌握的知识点和方法的类型,更有针对性的为学生制定辅导计划。

    数学题目一题多解实现方法、装置及平台

    公开(公告)号:CN109934350B

    公开(公告)日:2022-10-21

    申请号:CN201910215489.7

    申请日:2019-03-21

    发明人: 张阳 陈怡 郑文娟

    摘要: 一种数学题目一题多解实现方法,包括:通过NLP算法把数学题目转换成谓词信息并插入到drools推理引擎的事实空间,然后通过自动化推理技术整理事实空间中存在的所有事实和推理网络,匹配所有满足解题思路的解题步骤,形成初始的类人解题步骤;通过比较初始类人解题步骤中各解法之间的相似性,对初始类人解题步骤进行第一次筛选,筛选掉一部分重复的解题步骤;把第一次筛选后获得的解题步骤所对应的规则插入到规则与知识点、解题方法间的映射关系网络系统中进行匹配,得到每种解法各自对应的知识点和解题方法;通过比对所有解法中的知识点和方法,进行第二次筛选,选出具有不同知识点或具有不同方法的解法作为最终答案自动化输出。

    一种用于教育资源库的公式处理方法及系统

    公开(公告)号:CN113326675B

    公开(公告)日:2022-09-13

    申请号:CN202110889179.0

    申请日:2021-08-04

    发明人: 郑文娟

    摘要: 本发明涉及一种用于教育资源库的公式处理方法及系统,所述方法包括以下步骤:公式的识别;将识别的公式转化为Latex表达式,将Latex格式转化为高分辨率且背景为透明的图片;构造编辑器,所述构造编辑器基于Latex表达式在线实时编辑;在线编辑纠错提示;编辑完成后,按接收的风格样式要求,返回图片,并保存编辑后的Latex格式;在需要导出Word文档时,将选取题目中公式的Latex格式转化为Office Word中自带编辑器所需格式或Mathtype编辑器所需格式。本发明通过实现对录入公式的在线编辑及实时渲染,便利了入库题目的在线更改,增加题库建设的效率;渲染效果可以自定义设置,且分辨率高,大大增加了用户体验,也提高了公式应用效果。

    基于试卷图像的试题拆解方法、系统、存储介质及设备

    公开(公告)号:CN113610068B

    公开(公告)日:2022-07-08

    申请号:CN202111178939.3

    申请日:2021-10-11

    发明人: 李巧艳

    IPC分类号: G06V30/413 G06V30/416

    摘要: 本发明公开了一种基于试卷图像的试题拆解方法、系统、存储介质及设备,该基于试卷图像的试题拆解方法包括接收输入的试卷图像;对所述试卷图像进行元素分析,以识别出文字元素和非文字元素以及文字元素和非文字元素的定位信息,所述非文字元素包括侧边栏元素和图表元素;将所述非文字元素进行切除,并通过对所述文字元素进行识别,以将所述文字元素拆分成与所述试卷图像当中的每道试题对应的文字元素集合;将定位信息对应的文字元素集合和所述图表元素进行融合,得到所述每道试题的题目信息。本发明解决了现有技术中对图片类试卷中的试题进行电子化存档时操作繁琐且效率低下的问题。

    数学题目一题多解实现方法、装置及平台

    公开(公告)号:CN109934350A

    公开(公告)日:2019-06-25

    申请号:CN201910215489.7

    申请日:2019-03-21

    发明人: 张阳 陈怡 郑文娟

    IPC分类号: G06N5/04 G06F17/27 G06Q50/20

    摘要: 一种数学题目一题多解实现方法,包括:通过NLP算法把数学题目转换成谓词信息并插入到drools推理引擎的事实空间,然后通过自动化推理技术整理事实空间中存在的所有事实和推理网络,匹配所有满足解题思路的解题步骤,形成初始的类人解题步骤;通过比较初始类人解题步骤中各解法之间的相似性,对初始类人解题步骤进行第一次筛选,筛选掉一部分重复的解题步骤;把第一次筛选后获得的解题步骤所对应的规则插入到规则与知识点、解题方法间的映射关系网络系统中进行匹配,得到每种解法各自对应的知识点和解题方法;通过比对所有解法中的知识点和方法,进行第二次筛选,选出具有不同知识点或具有不同方法的解法作为最终答案自动化输出。

    一种题目文本句子向量生成方法及装置

    公开(公告)号:CN109960804A

    公开(公告)日:2019-07-02

    申请号:CN201910215490.X

    申请日:2019-03-21

    发明人: 梅阳阳 郑文娟

    IPC分类号: G06F17/27 G06F16/33 G06F16/35

    摘要: 一种题目文本句子向量生成方法,包括步骤:S1.根据题目文本表达筛选出所有关键词,加入词典,再对题目文本中的句子进行词典分词,同时对句子中出现的关键词进行标记;S2.基于分词结果和筛选出的所有关键词,通过分别对每条句子和其内包含的关键词编码后,再建立RNN模型采用随机剔除关键词的方法进行预测训练;S3.利用训练好的模型提取到的特征,对题目文本中的每条句子生成句子向量。