-
公开(公告)号:CN118898722A
公开(公告)日:2024-11-05
申请号:CN202411404225.3
申请日:2024-10-10
Applicant: 厦门理工学院
IPC: G06V10/422 , G06V10/80 , G06V10/774 , G06V10/82 , G06V10/10 , G06N3/0455 , G06N3/0442 , G06N3/0464 , G06N3/09
Abstract: 本发明公开了一种基于几何基元空间感知的平面几何自动解题方法,S1将待求解的几何图示和几何题目利用解析器按预设的规则,解析成文本子句,并输入Transformer Encoder中编码;S2将几何图示图像通过卷机神经网络分成64个图示补丁特征并通过自注意力机制学习视觉模态内部特征;S3将这些模态特征输入到多模态双支路空间感知预训练语言模块中以学习跨模态全局特征和几何基元空间信息,并输入到双向GRU编码器中以执行融合编码;S4将混合编码中的文本编码送入点基元空间注意力模块中增强模型对几何基元的空间感知能力;S5将增强的混合编码由自限GRU解码器解码,并生成顺序求解程序。
-
公开(公告)号:CN118898722B
公开(公告)日:2025-02-11
申请号:CN202411404225.3
申请日:2024-10-10
Applicant: 厦门理工学院
IPC: G06V10/422 , G06V10/80 , G06V10/774 , G06V10/82 , G06V10/10 , G06N3/0455 , G06N3/0442 , G06N3/0464 , G06N3/09
Abstract: 本发明公开了一种基于几何基元空间感知的平面几何自动解题方法,S1将待求解的几何图示和几何题目利用解析器按预设的规则,解析成文本子句,并输入Transformer Encoder中编码;S2将几何图示图像通过卷机神经网络分成64个图示补丁特征并通过自注意力机制学习视觉模态内部特征;S3将这些模态特征输入到多模态双支路空间感知预训练语言模块中以学习跨模态全局特征和几何基元空间信息,并输入到双向GRU编码器中以执行融合编码;S4将混合编码中的文本编码送入点基元空间注意力模块中增强模型对几何基元的空间感知能力;S5将增强的混合编码由自限GRU解码器解码,并生成顺序求解程序。
-