-
公开(公告)号:CN111340033B
公开(公告)日:2023-05-02
申请号:CN202010184590.3
申请日:2020-03-17
Applicant: 北京工业大学
Abstract: 本发明涉及一种易混字符二次识别方法,用于提高手写字符识别率。对易混字符图像进行细化操作,生成固定大小的目标图像;定义易混字符对“1”、“(”、“)”的直线特征、斜率特征、曲率特征,提取目标图像的特征向量,基于SVM分类器识别分类;定义易混字符对“1”、“9”的孔洞特征,设计基于孔洞特征的分类算法,实现“1”、“9”的二次识别;定义易混字符对“4”、“6”的交截点相对位置特征,设计基于交截点相对位置特征的分类算法,实现“4”、“6”的二次识别;定义易混字符对“7”、“>”的夹角特征、方向角特征、连续竖直点个数特征,提取目标图像的特征向量,基于SVM分类器识别分类;本发明可有效提高数学字符的平均识别率。
-
公开(公告)号:CN116010717A
公开(公告)日:2023-04-25
申请号:CN202310036486.3
申请日:2023-01-10
Applicant: 北京工业大学
IPC: G06F16/9536 , G06N3/08 , G06Q50/20 , G06N3/0464
Abstract: 本发明公开了一种基于自适应分组的图卷积神经网络试题推荐方法,首先在图卷积神经网络中引入了一个分组级别的注意力模块,使得网络本身可以自适应地对学生节点和试题节点进行分组,使得不同的分组对应不同的层次,然后在各个组内再进行图卷积操作,从而尽量隔绝掉从其他分组传递过来的可能会干扰模型学习的信息;同时在图卷积操作中引入一种残差连接,以尽量增加网络的深度。在公开数据集Junyi‑Math、AICFE‑Math上进行的大量实验表明该方法是有效的,在召回率Recall等相关指标上均优于对比的基准方法。
-
公开(公告)号:CN115659954A
公开(公告)日:2023-01-31
申请号:CN202211349918.8
申请日:2022-10-31
Applicant: 北京工业大学
IPC: G06F40/216 , G06F40/289 , G06F40/30 , G06N3/0442 , G06N3/045 , G06N3/08
Abstract: 本发明公开了一种基于多阶段学习的作文自动评分方法,该方法包括:S1特征提取,提取作文的浅层语言特征、情感特征和主题相关度特征;S2:主题相关度特征提取;S3:优美句识别模型构建和作文文采特征提取;S4:基学习器的训练;S5:作文向量分布式表示及特征融合模型训练预测。本发明应用在自动作文评分领域,针对中文作文评分设计了较为全面的、多维度的作文评分特征,实现对作文优美句的检测与发现,更好地考虑了作文中语言表达的优美程度;同时提出了基于多阶段学习的作文自动评分,有效结合了多角度的作文特征进行作文评分。
-
公开(公告)号:CN112464926A
公开(公告)日:2021-03-09
申请号:CN202011259598.8
申请日:2020-11-12
Applicant: 北京工业大学
Abstract: 本发明涉及一种联机中英文混合手写识别方法,用于在线输入法、在线输入系统中英文混合手写输入识别。首先,对联机中英文混合手写文本行进行倾斜矫正处理,并对其进行基于规则的过切分,其次,把过切分完成的字符片段进行中英文二分类,并且把字符片段通过路径评价、搜索算法得到一条字符合并最佳路径;最后,把每类字符送入相应的联机手写字符识别模型进行识别,把识别结果按照原先的顺序进行重组,最终得到联机中英文混合手写文本识别结果,实验证明,联机中英文混合手写识别率可达93.67%。
-
公开(公告)号:CN111062218A
公开(公告)日:2020-04-24
申请号:CN201911309345.4
申请日:2019-12-18
Applicant: 北京工业大学
IPC: G06F40/30
Abstract: 本发明基于对依存关系的语义相似度方法和同义词词林的语义相似度计算方法的研究,设计了一种基于依存关系与同义词词林相结合的语义相似度计算方法。该方法通过依存关系分别提取两个文本的关系路径,同时基于同义词词林计算两个文本之间关系路径的语义相似度。在计算两个文本之间的语义相似度时,使用语言技术平台(Language Technology Platform,LTP)对文本进行中文分词以及获取文本的依存关系图,从其中提取关系路径,从而可以结合关系路径和同义词词林计算两个文本之间的语义相似度。
-
公开(公告)号:CN113934814B
公开(公告)日:2024-05-28
申请号:CN202110877661.2
申请日:2021-08-01
Applicant: 北京工业大学
IPC: G06F16/33 , G06F40/211 , G06F40/247 , G06F40/289 , G06F40/30 , G06F18/214
Abstract: 本发明公开了古诗文主观题自动评分方法,通过对语文古诗文阅读类主观题的分析,提出了结合学科情感分析模型与依存关系的相似度评分算法。以中文维基百科语料为基础,扩充了与评分相关的古诗文,共计81927条,通过Word2vec模型进行词向量训练,构建了古诗文基础语料库;基于学科评分特性建立了对应的古诗文过滤词表;针对情感分析模型对古诗文语句分析不准确的问题,结合同义词词林,建立了古诗文情感词库;构建了学科情感分析模型,将其与StanfordCoreNLP的依存句法分析相结合,实现了相似度评分算法,并将其应用于古诗文的阅卷评分。实验表明,该算法的平均评分准确率达到了89.42%。
-
-
公开(公告)号:CN113936181A
公开(公告)日:2022-01-14
申请号:CN202110877654.2
申请日:2021-08-01
Applicant: 北京工业大学
IPC: G06V10/774 , G06V10/26 , G06V10/44 , G06V30/148
Abstract: 本发明公开了一种粘连手写英文字符的识别方法,用于粘连字符的切分和识别。首先,基于图像的结构特征找到候选切分点,以此作为切分算法的起始切分点,设计切分规则确定切分路径;对不同类型的粘连字符,采用多策略切分方式进行精准切分;最后通过构建切分路径评价方法确定最优切分路径。对切分后的手写英文字符,送入利用卷积神经网络训练得到的识别模型进行识别,最终得到粘连手写英文字符的识别结果。
-
公开(公告)号:CN113723413A
公开(公告)日:2021-11-30
申请号:CN202110877660.8
申请日:2021-08-01
Applicant: 北京工业大学
Abstract: 本发明公开了一种基于贪吃蛇的手写中文文本切分方法,该方法用于图像文本的切分。首先,根据文本行的垂直投影直方图和字符笔画宽度自适应计算字符间笔画薄弱位置,利用贪吃蛇算法在该区域内建立初始切分轨迹,并制定多重约束规则优化切分路径,实现手写文本的粗切分;然后,根据字符宽度和宽高比阈值筛选粘连字符,从粘连字符的轮廓曲线和骨架特征入手,选取粘连切分点,并利用贪吃蛇算法进行二次切分;最后,结合汉字的结构特征和汉字识别置信度完成过切分字符的合并,得到最终正确的文本切分结果。
-
公开(公告)号:CN110059760B
公开(公告)日:2021-04-30
申请号:CN201910337675.8
申请日:2019-04-25
Applicant: 北京工业大学
Abstract: 本发明涉及一种基于拓扑结构和CNN的几何图形识别方法,用于识别平面几何图形。首先,对原图形进行预处理,得到不包含字母的、前景为白色的几何图形;然后再进行霍夫直线检测,合并检测结果中属于同一条边的线段,提取几何图形的边;接着,计算边与边的交点,得到图形各顶点及形成顶点的边编号;之后,根据顶点与边的关联关系获取顶点间邻接关系,用以表示图形拓扑结构;在保证几何图形拓扑结构不变的前提下,通过在预设容忍度内移动图形顶点构建同构图形库作为基础训练集,并进行扩充;最后,以加深隐藏层层数、增加各层卷积核个数的方式改进LeNet‑5模型,基于同构图形训练集进行自动特征提取和学习,完成对平面几何图形的识别。
-
-
-
-
-
-
-
-
-