Patent search ap:("厦门理工学院" OR "众数(厦门)信息科技有限公司") AND inv:"朱顺痣" Page 5

41.

发明授权
基于跨域截断式迁移学习的放大内镜图像病变分类方法有权

公开(公告)号：CN119229220B

公开(公告)日：2025-02-18

申请号：CN202411746649.8

申请日：2024-12-02

Applicant: 厦门理工学院

Inventor： 吴芸 , 何林睿 , 吴嘉骅 , 王大寒 , 朱顺痣 , 胡延兴

IPC: G06V10/764 , G06V10/82 , G06V10/774 , G06N3/096

Abstract: 本发明提供了基于跨域截断式迁移学习的放大内镜图像病变分类方法，包括获取放大内镜的真实图像、病变类别，构建训练、验证和测试数据集；构建基于跨域截断式迁移学习的放大内镜图像病变分类模型，设置截断点后进行训练，得到训练后的放大内镜图像病变分类模型；利用验证数据集对模型进行评估，根据验证结果调整模型参数，确定最终的模型；利用测试数据集进行测试，将经过测试的放大内镜图像病变分类模型应用于实际的放大内镜图像病变分类任务中。该方法适用于关于放大内镜图片病变类别工作，在模型训练过程中利用分层截断策略以及动态学习率调整机制，提升了模型的分类精度和训练效率，具有较强的实用性和推广价值。

42.

发明授权
一种基于注意力导向细节修复的文档图像阴影去除方法有权

公开(公告)号：CN118898847B

公开(公告)日：2025-01-17

申请号：CN202411390566.X

申请日：2024-10-08

Applicant: 厦门理工学院

Inventor： 杨帆 , 江楠峰 , 何一凡 , 吴芸 , 王大寒 , 朱顺痣

IPC: G06V30/16 , G06V30/18 , G06V10/82 , G06N3/0464

Abstract: 本发明提出一种基于注意力导向细节修复的文档图像阴影去除方法，包括以下步骤；步骤S1、利用YCbCr颜色空间变换和亮度信息生成阴影注意力图作为标签，以识别阴影区域；步骤S2、通过阴影注意力生成子网络，采用多尺度大核注意力机制，提取阴影特征，获得最优注意力图；步骤S3、对所述最优注意力图和阴影特征进行动态融合；步骤S4、通过细节细化子网络，采用轻量级空间通道卷积计算并恢复图像细节；步骤S5、基于损失函数，通过端到端训练优化网络参数；步骤S6、使用训练完成的网络对文档图像进行阴影去除处理。旨在有效去除文档图像中的复杂阴影，同时保留图像细节，并以较低的计算复杂度实现。

43.

发明公开
基于多模态大模型的甲骨文字图像识别方法、装置、设备和介质有权

公开(公告)号：CN119251852A

公开(公告)日：2025-01-03

申请号：CN202411774132.X

申请日：2024-12-05

Applicant: 厦门理工学院

Inventor： 王大寒 , 童浩 , 张煦尧 , 李焜炽 , 朱顺痣

IPC: G06V30/22 , G06V30/19 , G06V10/82 , G06F40/30 , G06F40/56 , G06F40/58 , G06N3/045 , G06N3/08

Abstract: 一种基于多模态大模型的甲骨文字图像识别方法、装置、设备和介质，涉及计算机视觉技术领域。其中，这种甲骨文字图像识别方法首先，从OBIMD数据集提取甲骨文单字图像，并从镜原甲骨平台检索基础信息，形成单字数据集。接着，利用大语言模型生成包含文字释义等信息的第一对话数据集，并对Qwen2VL模型进行微调，得到初始识别模型。然后，通过位置信息对话数据集进行第二微调，获得定位顺序识别模型，该模型能识别字符并完成定位标注。进一步，生成现代汉语翻译对话数据集，并对模型进行第三微调，得到语义识别模型，能组合字符成句并翻译。最后，输入待识别甲骨图像，模型根据图像是单字或多字，分别输出字符标识、释义或组合句子并翻译成现代汉语。

44.

发明公开
一种基于病理信息引导的扩散模型放大内镜图像生成方法有权

公开(公告)号：CN119228940A

公开(公告)日：2024-12-31

申请号：CN202411774131.5

申请日：2024-12-05

Applicant: 厦门理工学院

Inventor： 吴嘉骅 , 何林睿 , 王大寒 , 吴芸 , 朱顺痣 , 胡延兴

IPC: G06T11/00 , G06V10/774 , G06N3/0455 , G06N3/0464 , G06N3/0475 , G06N3/084

Abstract: 本发明提供了一种基于病理信息引导的扩散模型放大内镜图像生成方法，包括获取放大内镜的真实图像、Mask图像和病理信息文本提示，构建训练、测试数据集；构建基于病理信息引导的放大内镜图像生成模型通过训练数据集进行训练，得到训练好的放大内镜图像生成模型；利用测试数据集进行测试，评估其在未知数据上的性能，评估合格的即为最终得到的放大内镜图像生成模型；将最终得到的放大内镜图像生成模型应用于放大内镜图像生成工作，获取模型生成的放大内镜图像。该方法适用于关于放大内镜图片生成工作，利用病理信息和背景Mask图片引导的方式来精准生成不同病理的放大内镜图片，有效的解决了关于放大内镜图片下游分割和分类任务的数据不平衡问题。

45.

发明公开
一种基于不确定性与图神经网络的多视图聚类方法有权

公开(公告)号：CN119206279A

公开(公告)日：2024-12-27

申请号：CN202411729686.8

申请日：2024-11-29

Applicant: 厦门理工学院

Inventor： 肖顺鑫 , 曾葆 , 李建敏 , 王大寒 , 朱顺痣

IPC: G06V10/762 , G06V10/774 , G06V10/74 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0442 , G06N3/0464 , G06N3/084

Abstract: 本发明提供的一种基于不确定性与图神经网络的多视图聚类方法，涉及多视图聚类技术领域。本发明通过获取多视图数据集，进行预处理后，得到原始特征矩阵与邻接矩阵；对输入的所述原始特征矩阵和所述邻接矩阵进行特征提取与融合后，得到一致嵌入矩阵与转移矩阵；基于Dempster‑Shafer证据理论与狄利克雷分布，通过降低所述一致嵌入矩阵中嵌入空间的不确定性，得到可靠一致嵌入；将所述可靠一致嵌入与所述转移矩阵映射为最终嵌入；对所述最终嵌入进行解码重建与聚类分析，得到聚类结果。本发明能充分挖掘视图中的潜在信息，降低模型中的不确定性，解决了多视图聚类任务中存在的噪声问题，能够快速、高效、准确地得到多视图数据的聚类结果。

46.

发明公开
一种基于稀疏与远邻节点增强的图表示学习方法有权

公开(公告)号：CN119204096A

公开(公告)日：2024-12-27

申请号：CN202411707990.2

申请日：2024-11-27

Applicant: 厦门理工学院

Inventor： 李建敏 , 高恒 , 肖顺鑫 , 王大寒 , 朱顺痣

IPC: G06N3/042 , G06N3/084 , G06F18/214 , G06F18/2415

Abstract: 本发明提供的一种基于稀疏与远邻节点增强的图表示学习方法，涉及数据增强技术领域。本发明根据获取的待增强的图结构数据集，得到初始节点特征矩阵、邻接矩阵与原始分类标签，并划分训练集与测试集；利用特征增强技术对训练集的节点特征进行强化，得到稀疏增强图结构数据集；然后结合节点混合技术，通过对类内节点和类间节点进行特征和分类标签的混合，以增加远邻节点的可达性，得到远邻增强图结构数据集；将远邻增强图结构数据集输入图神经网络模型进行图表示学习与训练，从而得到最优的节点表示与训练好的图表示学习模型；最后经模型测试评估，得到评估好的模型。本发明解决了传统图神经网络在处理稀疏节点和远邻节点信息聚合时的不足。

47.

发明公开
一种应用于扭曲文档的文档图像校正方法及其装置审中-实审

公开(公告)号：CN118711191A

公开(公告)日：2024-09-27

申请号：CN202410510028.3

申请日：2024-04-26

Applicant: 厦门理工学院 , 福建火炬电子科技股份有限公司

Inventor： 朱顺痣 , 周欣玥 , 李建敏 , 黄智财 , 薛瑞斌 , 张美贵 , 郑成和 , 严庆强 , 刘梦颖

IPC: G06V30/16 , G06V30/14 , G06V30/148 , G06V30/18 , G06V30/19 , G06V30/41 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/084 , G06N3/048

Abstract: 本发明提出一种应用于扭曲文档的文档图像校正方法及其装置，包括：构建并训练获得基于几何失真和照明表征的文档图像校正模型；将待检测的文档图像信息输入获得的所述校正模型中，得到几何校正后的文档图像，再根据所述文档图像所受的环境光信息区分是否需要进行亮度表征学习；对于所受的环境光信息很差的文档图像，将经过几何表示学习后把图像输入到亮度表征模型中，得到亮度表征学习后的文档图像；对于照明条件良好的图像，则不需要进行亮度表征学习；将输出的文档图像结果，输出至下游任务进行文字识别或者关键信息提取处理。实现对歪曲的和环境光差的文档图像分别进行几何表示和亮度表征学习；同时引入多层注意力机制提高文档图像校正的精度。

48.

发明公开
一种基于文本图像对齐的电容检测报告文档检索方法审中-实审

公开(公告)号：CN118606498A

公开(公告)日：2024-09-06

申请号：CN202410709765.6

申请日：2024-06-03

Applicant: 福建火炬电子科技股份有限公司 , 厦门理工学院

Inventor： 薛瑞斌 , 朱顺痣 , 黄智财 , 李建敏 , 张美贵 , 郑成和 , 严庆强 , 刘梦颖

IPC: G06F16/532 , G06F16/51 , G06F16/583 , G06F16/55 , G06F40/30 , G06F18/25 , G06F18/213 , G06F18/2433 , G06N3/0464 , G06N3/0455 , G06N3/048

Abstract: 本发明公开一种基于文本图像对齐的电容检测报告文档检索方法，提取文档图像的语义特征#imgabs0#和待搜索关键字的语义特征#imgabs1#；图像语义特征#imgabs2#和文本语义特征#imgabs3#融合得到自注意力对齐修正后的概率特征图#imgabs4#；基于所述概率特征图#imgabs5#通过设定阈值Hr得到文档图像的二值图Bm，获取文本框位置；基于概率特征图#imgabs6#通过设定阈值Ht进行特征选择，提取每个文本行的特征区域，构建出概率特征图#imgabs7#上所有存在文本的选择特征集合；基于所述选择特征集合进行GLR预测，得到包含待搜索关键字的位置信息，将位置信息映射到二值图Bm的文本框中，从而得到待搜索关键字在所述输入的文档图像中的位置。此种方法能够实现高效准确地对电容检测报告进行关键词检索和定位。

49.

发明公开
基于音高调制的音频稀疏对抗攻击方法、装置、设备及介质有权

公开(公告)号：CN118471253A

公开(公告)日：2024-08-09

申请号：CN202410917115.0

申请日：2024-07-10

Applicant: 厦门理工学院

Inventor： 杜侠 , 谢旺泽 , 许奇臻 , 谢小竹 , 朱顺痣

IPC: G10L25/27 , G10L25/87 , G10L25/90 , G10L25/48

Abstract: 本发明提供了基于音高调制的音频稀疏对抗攻击方法、装置、设备及介质，包括：进行音调移位，将输入音频进行音调移位，以改变音频的频率并引发ASR系统的初步误识别；使用语音活动检测识别音频中的活跃语音片段，生成二进制掩码以标识这些片段；进行稀疏噪声生成；将优化后的扰动向量与掩码向量相结合，生成最终的对抗性音频样本，使其能够有效攻击ASR系统并且难以被人耳察觉。本发明实现了在保持对抗性音频可听性的同时，简化攻击过程并提高了对抗性噪声的隐蔽性和有效性。

50.

发明公开
一种基于多样特征生成的零样本汉字识别方法有权

公开(公告)号：CN118378621A

公开(公告)日：2024-07-23

申请号：CN202410808562.2

申请日：2024-06-21

Applicant: 厦门理工学院

Inventor： 王大寒 , 潘松良 , 何一凡 , 张煦尧 , 李晓辉 , 朱顺痣

IPC: G06F40/279 , G06F40/30 , G06F40/284 , G06N3/045 , G06N3/0475 , G06N3/08

Abstract: 本发明提出一种基于多样特征生成的零样本汉字识别方法，解析汉字的部首组成获取表意描述序列；对表意描述序列进行混合语义嵌入获得多语义向量；对已见类汉字图像进行特征提取获取真实特征；构建特征生成网络学习多语义向量到真实特征的映射；通过已见类训练集进行训练后通过多种未见类语义向量生成未见类特征；利用未见类特征结合已见类训练集的特征共同训练识别模型使其具备识别已见类和未见类汉字能力。本发明通过混合语义嵌入提供多种语义来生成训练样本，有助于缓解合成特征的域迁移问题和特征混淆问题，提高特征生成的泛化能力和鲁棒性；通过为识别模型提供高质量的未见类特征，缓解零样本汉字识别的偏倚问题，提高了未见汉字的识别能力。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification