-
公开(公告)号:CN115795150A
公开(公告)日:2023-03-14
申请号:CN202211484581.1
申请日:2022-11-24
Applicant: 之江实验室 , 浙江杭钢职业教育集团有限公司
IPC: G06F16/9535 , G06F40/30 , G06F18/22 , G06F17/18
Abstract: 本发明公开了一种基于特征离散系数和注意力机制的智能人岗匹配方法,所述方法包括获取简历/岗位文本语料对预训练语义抽取模型进行模型精调;根据各个字段的描述类型将简历/岗位文本语料划分为文本特征、数值型特征、等级型特征;根据不同特征类型分析简历/岗位文本语料以提取特征,并存储于向量数据库中;取应聘者在客户端最近的前N条浏览记录,在向量数据库中查找浏览记录对应的各特征值,以计算应聘者的兴趣画像和各特征对应的兴趣度;对于每一个候选岗位推荐项,根据岗位的各个特征值与对应特征的兴趣画像之间的相似度与该特征的兴趣度得到匹配度;对各候选项的匹配度进行排序,得到推荐结果。
-
公开(公告)号:CN117150151B
公开(公告)日:2024-02-20
申请号:CN202311436886.X
申请日:2023-11-01
Applicant: 之江实验室
IPC: G06F16/9536 , G06N20/00 , G06F18/22
Abstract: 本发明公开了一种基于大语言模型的错题分析及试题推荐系统和方法,属于在线教育和自然语言处理技术领域,包括:获取学生做题的历史数据整合得到答题数据,将答题数据和人为给定的答题指令输入智能算法得到指令数据;指令数据作为训练数据,采用LoRA方案对大语言模型ChatGLM‑6B进行指令微调,经过优化器优化,得到训练好的错题分析模型,将答题数据输入训练好的错题分析模型得到错题分析结果;试题推荐模型,采用DINA算法和基于内容的协同过滤算法得到个性化习题,与错题分析结果一起发送给学生。本发明能够实现文字类全题型的在线错题分析,辅助教师进行教学,并为学生提供更具个性化、交互性好的试题推荐系统。
-
公开(公告)号:CN116976351B
公开(公告)日:2024-01-23
申请号:CN202311228568.4
申请日:2023-09-22
Applicant: 之江实验室
IPC: G06F40/295 , G06F40/216 , G06F40/284 , G06F18/24 , G06F18/214 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于学科实体的语言模型构建方法,包括以下步骤:获取教学资源以构建对应的初始数据集;对初始数据集进行学科实体筛选,以构建对应的学科实体库;将所述学科实体库中的学科实体进行随机遮蔽以获得对应的遮蔽词,以所述学科实体与相应的遮蔽词组成数据集;构建语言神经网络包括前置编码层,特征提取层以及预测层;采用数据集对语言神经网络进行训练,以获得用于挖掘学科实体的学科实体语言模型;将待识别的教学资源输入至学科实体语言模型中,以输出文本中包含的学科实体。本发明还提供了一种学科实体识别装置。本发明提供的方法构建的语言模型可以获取教育领域(56)对比文件Shashank Patel 等.Summarization andSimplification of Medical Articles usingNatural Language Processing《.2022 13thInternational Conference on ComputingCommunication and Networking Technologies(ICCCNT)》.2022,第1-6页.王雨扬.基于知识图谱的在线教学资源库智能化改造关键技术研究与实现《.中国优秀硕士学位论文全文数据库 社会科学Ⅱ辑》.2023,第2023年卷(第2期),第24-25页.张璐.基于中文命名实体识别的高中化学试题检索方法研究及应用《.万方》.2023,第1.2节、第3章.张璐.基于中文命名实体识别的高中化学试题检索方法研究及应用《.万方》.2023,第1.2节、第3章.
-
公开(公告)号:CN116912867B
公开(公告)日:2023-12-29
申请号:CN202311175495.7
申请日:2023-09-13
Applicant: 之江实验室
IPC: G06V30/413 , G06V30/19 , G06V30/18 , G06V20/70
Abstract: 本发明公开了一种结合自动标注和召回补全的教材结构提取方法和装置,将教材PDF转换为图片,并通过高精度OCR识别出图片中的每个区域的文本信息和位置信息,再结合规则模型和聚类来构建样本,并利用样本训练与区域类型对应的多种分类模型来预测区域类型未知的区域类型,最后自动召回补全缺失的部分并建立整本教材的内容及结构关系,这样能够顾实现快速准确地从教材中快速准备地提取出标题和正文,并建立相应的结构关系。
-
公开(公告)号:CN117058704A
公开(公告)日:2023-11-14
申请号:CN202311190777.4
申请日:2023-09-15
Applicant: 之江实验室
IPC: G06V30/42 , G06V30/413 , G06V30/416 , G06V30/148
Abstract: 本发明公开了一种基于视觉和文本特征的教材内容及结构的提取方法和装置,包括:读取PDF教材并将每个页面转成图片;对图片进行灰度转换、膨胀、腐蚀操作得到预处理后图片;基于空白区域对预处理后图片进行区域分割以得到多个区域块;采用OCR识别区域块中文本字符,并建立文本字符与区域块的对应关系;对区域块进行页眉页脚识别,并去除页眉页脚对应的区域块;对剩余区域块基于视觉规则和文本规则共同进行区域类型判断,其中,区域类型包括标题、正文以及自定义类型;根据区域类型和文本字符与区域块的对应关系建立取PDF教材的结构关系。该方法和装置能够实现结构化信息提取,适用于包含图片格式等各种类型的PDF文件。
-
公开(公告)号:CN116912867A
公开(公告)日:2023-10-20
申请号:CN202311175495.7
申请日:2023-09-13
Applicant: 之江实验室
IPC: G06V30/413 , G06V30/19 , G06V30/18 , G06V20/70
Abstract: 本发明公开了一种结合自动标注和召回补全的教材结构提取方法和装置,将教材PDF转换为图片,并通过高精度OCR识别出图片中的每个区域的文本信息和位置信息,再结合规则模型和聚类来构建样本,并利用样本训练与区域类型对应的多种分类模型来预测区域类型未知的区域类型,最后自动召回补全缺失的部分并建立整本教材的内容及结构关系,这样能够顾实现快速准确地从教材中快速准备地提取出标题和正文,并建立相应的结构关系。
-
公开(公告)号:CN116521886A
公开(公告)日:2023-08-01
申请号:CN202310135812.6
申请日:2023-02-20
Applicant: 之江实验室
Abstract: 本发明公开了一种基于深度学习的教育领域知识图谱构建方法和装置,该方法首先获取教育领域的多源数据;再对多源数据进行结构化提取,得到关键词和知识点;之后根据关键词之间的前后置关系,构成关键词骨架;接着应用关键词骨架对知识点进行前后置关联关系的提取;应用关键词骨架和知识点前后置关系推导得出知识点框架;最后利用知识点框架,使用无监督方式和相似度计算方式进行知识融合,构建学科知识图谱。本发明从总海量的教学资源数据中,提取出知识点及关联关系,构建教学资源知识图谱,从而赋能教学领域的智能化应用,为人工智能与教育的结合提供基础性支持。
-
公开(公告)号:CN117058704B
公开(公告)日:2024-01-05
申请号:CN202311190777.4
申请日:2023-09-15
Applicant: 之江实验室
IPC: G06V30/42 , G06V30/413 , G06V30/416 , G06V30/148
Abstract: 本发明公开了一种基于视觉和文本特征的教材内容及结构的提取方法和装置,包括:读取PDF教材并将每个页面转成图片;对图片进行灰度转换、膨胀、腐蚀操作得到预处理后图片;基于空白区域对预处理后图片进行区域分割以得到多个区域块;采用OCR识别区域块中文本字符,并建立文本字符与区域块的对应关系;对区域块进行页眉页脚识别,并去除页眉页脚对应的区域块;对剩余区域块基于视觉规则和文本规则共同进行区域类型判断,其中,区域类型包括标题、正文以及自定义类型;根据区域类型和文本字符与区域块的对应关系建立取PDF教材的结构关系。该方法和装置能够实现结构化信息提取,适用于包含图片格式等各种类型的PDF文件。
-
公开(公告)号:CN117150151A
公开(公告)日:2023-12-01
申请号:CN202311436886.X
申请日:2023-11-01
Applicant: 之江实验室
IPC: G06F16/9536 , G06N20/00 , G06F18/22
Abstract: 本发明公开了一种基于大语言模型的错题分析及试题推荐系统和方法,属于在线教育和自然语言处理技术领域,包括:获取学生做题的历史数据整合得到答题数据,将答题数据和人为给定的答题指令输入智能算法得到指令数据;指令数据作为训练数据,采用LoRA方案对大语言模型ChatGLM‑6B进行指令微调,经过优化器优化,得到训练好的错题分析模型,将答题数据输入训练好的错题分析模型得到错题分析结果;试题推荐模型,采用DINA算法和基于内容的协同过滤算法得到个性化习题,与错题分析结果一起发送给学生。本发明能够实现文字类全题型的在线错题分析,辅助教师进行教学,并为学生提供更具个性化、交互性好的试题推荐系统。
-
公开(公告)号:CN117011945A
公开(公告)日:2023-11-07
申请号:CN202311278527.6
申请日:2023-10-07
Applicant: 之江实验室
Abstract: 本申请涉及一种动作能力评估方法、装置、计算机设备及可读存储介质。所述方法包括:获取待识别图像;基于所述待识别图像确定待识别对象的第一人脸梯度特征以及第一人脸深度特征;基于所述第一人脸梯度特征以及第一人脸深度特征确定所述待识别对象的身份信息;基于所述身份信息确定所述待识别对象的动作图像,并基于所述动作图像确定动作评估结果。本申请一方面能够提高身份识别的准确度,另一方面,可以实现同时对多个对象进行动作能力评估,避免了人工测评存在的效率较低和主观性较高的问题,有效提高了动作能力评估的效率。
-
-
-
-
-
-
-
-
-