-
公开(公告)号:CN117577094A
公开(公告)日:2024-02-20
申请号:CN202311428936.X
申请日:2023-10-31
Applicant: 海南大学 , 海南经贸职业技术学院 , 海南师范大学
Abstract: 本发明涉及语音识别技术领域,公开了一种海南方言语音识别系统,包括特征提取模块和音素识别模块;特征提取模块通过对原始海南方言语音提取出各种语音特征,音素识别模块将所述语音特征依次通过卷积神经网络、残差网络、多头注意力机制以及长短期记忆网络组合而成的声学模型得到发音底层特征,通过全连接层映射到合适的维度,生成音素串;经过CTC损失函数计算预测的音素串与真实的音素串的差值,通过Ad‑am算法对模型中的参数进行优化,得到音素错误率;根据发音底层特征,利用海南方言发音底层特征进行方言语音识别。本发明能够有效提取不同方言特有的音素串发音底层特征,同时多种语音特征的融入使得方言语音识别性能得到大幅度提升。
-
公开(公告)号:CN119398176A
公开(公告)日:2025-02-07
申请号:CN202411541665.3
申请日:2024-10-31
Applicant: 海南大学
IPC: G06N5/04 , G06N5/022 , G06N20/00 , G06F40/166 , G06F40/103 , G16H80/00
Abstract: 本申请属于计算机技术领域,具体公开了一种基于大型语言模型的医疗对话服务装置及系统,该装置包括:数据集构建模块、模型训练模块和模型应用模块;数据集构建模块包括对话样本重构单元、知识图谱问答对生成单元和对话样本改写单元;模型训练模块,用于基于重构后的对话样本、知识图谱问答对和改写后的对话样本,对大型语言模型进行训练,获取训练后的大型语言模型;模型应用模块,用于输入对话请求所携带的提问内容至训练后的大型语言模型,获取回答内容。通过本申请能够实现针对实际医疗咨询场景,以端到端对话的方式向用户提供高质量的医疗对话服务。
-
公开(公告)号:CN116932722A
公开(公告)日:2023-10-24
申请号:CN202310933589.X
申请日:2023-07-26
Applicant: 海南大学
IPC: G06F16/332 , G06F16/36 , G06N5/025 , G06F18/213 , G06F18/241 , G06F18/25 , G06V10/40 , G06V10/764 , G06V10/80 , G16H30/00
Abstract: 本发明提供了一种基于跨模态数据融合的医学视觉问答方法及系统,包括:基于文本特征提取网络、图像特征提取网络、特征融合网络、知识图谱学习网络和分类网络,构建多任务学习模型;实体预测任务和答案预测任务共用分类网络中除输出层之外的网络层;基于样本医学图像、对应的有答案标签的样本问题文本以及医学知识图谱,以实体预测任务和答案预测任务的损失为约束,训练多任务学习模型;基于训练完成的多任务学习模型,构建答案预测模型;将待预测的医学图像及其对应的问题文本输入至答案预测模型,获得问题文本的答案。本发明解决了现有的医疗图像数据集标注难度大,标注样本少的问题,在医疗图像问答的任务上达到了较高的准确率。
-
公开(公告)号:CN119206584A
公开(公告)日:2024-12-27
申请号:CN202411351930.1
申请日:2024-09-26
Applicant: 海南大学
IPC: G06V20/40 , G06V40/10 , G06V10/764 , G06V10/25 , G06V10/82 , G06V40/16 , G06N3/0464
Abstract: 本申请属于动态修正的课堂学生状态多模态识别方法及系统,方法包括:获取课堂内的视频图像,对所述视频图像进行人物检测和截取,得到视频中携带学生信息的截取图像;基于所述截取图像对学生状态进行分类,得到分类结果,基于所述截取图像对学生身份进行识别,得到学生身份信息;利用多模态大语言模型对所述分类结果进行动态修正,得到学生状态时间轴;基于所述学生身份信息和学生状态时间轴进行学生状态识别,得到课堂内学生的状态识别结果和行为评价结果。通过本申请能够提高识别准确度和识别效率。
-
公开(公告)号:CN118982797A
公开(公告)日:2024-11-19
申请号:CN202410998743.6
申请日:2024-07-24
Applicant: 海南大学
IPC: G06V20/54 , G06V10/44 , G06V10/774 , G06V10/764 , G06V10/82 , G06N3/0464
Abstract: 本申请属于车辆重新识别领域,具体公开了一种基于遥感图像的车辆识别方法、装置及电子设备,方法包括:获取车辆待识别的遥感图像;将所述遥感图像输入到训练好的识别模型中,得到所述遥感图像的识别结果;其中,所述识别模型是利用残差网络和空间注意力网络建立的,所述识别模型通过对遥感图像样本进行特征图提取、部分多样性正则化以及部分一致性正则化以确定正则化约束,根据所述正则化约束和模型训练损失确定综合损失函数,并利用综合损失函数对模型进行端到端的训练得到。通过本申请,可提高车辆识别的准确性和效率。
-
公开(公告)号:CN118428914A
公开(公告)日:2024-08-02
申请号:CN202410527710.3
申请日:2024-04-29
Applicant: 海南大学
IPC: G06Q10/105 , G06F16/9035
Abstract: 本申请属于就业信息领域,具体公开了一种就业推荐方法、装置、电子设备及存储介质,方法包括:获取岗位向量和待就业应届生的学生向量,并利用注意力机制模型对所述岗位向量和学生向量进行匹配,得到学生的自身匹配结果;获取所述待就业应届生和往届生之间的相似度矩阵,并基于SimRank算法获取相似度矩阵节点之间的间接相似性;基于预设的相似度阈值对所述间接相似性进行筛选,确定与待就业应届生相似的目标往届生;确定自身匹配结果中学生集和岗位集之间的匹配得分,基于所述目标往届生的就业情况结合所述匹配得分,对所述自身匹配结果进行优化,得到待就业应届生的就业推荐结果。通过本申请能够提高应届生的就业推荐效率,使得岗位推荐更加准确。
-
公开(公告)号:CN114998702B
公开(公告)日:2024-08-02
申请号:CN202210466825.7
申请日:2022-04-29
Applicant: 海南大学
IPC: G06V10/82 , G06V10/26 , G06V10/44 , G06V10/764 , G06V10/80 , G06N3/0464 , G06F16/36
Abstract: 本发明公开了一种基于BlendMask的实体识别、知识图谱生成方法及系统,其中,采用BlendMask改进模型对每张图像依次进行图像预处理、特征融合、图像分割和实体识别操作,从而得到图像中各个实体的分割区域、实体名和精确度;另外,本发明将从文本中提取的实体、类别以及关系信息,与从图像中识别的实体信息结合,以类别和实体作为节点,并以关系为边生成对应的知识图谱。由于本发明对现有的BlendMask模型进行了改进:在特征融合操作中采用7*7的空洞卷积核;空洞卷积核能够在扩大感受野的同时不降低图像分辨率,因此本发明提供的实体识别方法更加精准,对应的图谱生成方法也更加全面。
-
公开(公告)号:CN114860937A
公开(公告)日:2022-08-05
申请号:CN202210535985.2
申请日:2022-05-17
Applicant: 海南大学
IPC: G06F16/35 , G06F40/211 , G06F40/289
Abstract: 本发明提供了一种基于中文仿生文献摘要的句子分类方法及系统,属于文本分类领域,方法为:对句子数据库中未进行人工标注句子类别的句子分别采用词频分析方法和输入初始Bert模型中进行分类;将第一分类结果集和第二分类结果集中分类结果一致的句子存入分类数据库;在第一分类结果集中剔除分类数据库中的句子,采用本次迭代后的Bert模型对第一分类结果集再次分类,更新第一分类结果集;采用较上次迭代更小的分词粒度的词频分析方法对第二分类结果集再次分类,更新第二分类结果集;依次类推,实现句子分类。本发明减少实体抽取和关系抽取中的人工标注,可减少人力和时间的成本。
-
公开(公告)号:CN114860937B
公开(公告)日:2024-08-06
申请号:CN202210535985.2
申请日:2022-05-17
Applicant: 海南大学
IPC: G06F16/35 , G06F40/211 , G06F40/289
Abstract: 本发明提供了一种基于中文仿生文献摘要的句子分类方法及系统,属于文本分类领域,方法为:对句子数据库中未进行人工标注句子类别的句子分别采用词频分析方法和输入初始Bert模型中进行分类;将第一分类结果集和第二分类结果集中分类结果一致的句子存入分类数据库;在第一分类结果集中剔除分类数据库中的句子,采用本次迭代后的Bert模型对第一分类结果集再次分类,更新第一分类结果集;采用较上次迭代更小的分词粒度的词频分析方法对第二分类结果集再次分类,更新第二分类结果集;依次类推,实现句子分类。本发明减少实体抽取和关系抽取中的人工标注,可减少人力和时间的成本。
-
公开(公告)号:CN116934777A
公开(公告)日:2023-10-24
申请号:CN202310933413.4
申请日:2023-07-26
Applicant: 海南大学
IPC: G06T7/11 , G06N3/0464 , G06N7/01 , G06N3/08 , G06N5/04
Abstract: 本发明公开了一种不确定性引导的视网膜血管图像分割方法及系统,属于医学图像处理领域。本发明首先构建不确定性网络来量化眼底图像中的不确定性得到不确定性映射矩阵,并将所述不确定性网络输出的均值作为先验映射矩阵;再构建基于UNet的分割网络,将编码阶段得到的特征图与不确定性映射矩阵进行多次特征融合,以学习眼底图像中不确定性区域;分割网络的损失函数由先验损失函数和交叉熵损失函数结合组成,其中先验损失函数基于先验映射矩阵构建;再将眼底图像训练集输入至所述分割网络训练所述分割网络;最后将眼底图像输入训练完成的分割网络后即可得到视网膜血管分割图像,本发明有效提高了视网膜血管分割性能,具有实际的临床价值。
-
-
-
-
-
-
-
-
-