-
公开(公告)号:CN115272308A
公开(公告)日:2022-11-01
申请号:CN202211171283.7
申请日:2022-09-26
Applicant: 安徽省儿童医院(安徽省新华医院、安徽省儿科医学研究所、复旦大学附属儿科医院安徽医院) , 中国科学技术大学
Abstract: 本发明公开了一种下肢骨骼图像评估下肢力线方法、系统、设备及存储介质,包括如下方法:步骤S1、准备下肢骨骼的X射线图像;步骤S2、用GVV‑Net模块对X射线图像进行处理,在特征最深层使用VIA模块;步骤S3、SDM模块在VIA模块提取的数据信息中;步骤S4、数据信息中特征点的全局结构信息检测X射线图像中的下肢解剖标志,得到下肢骨骼的热力图并提取每个通道最大热力值的位置点作为关键点;步骤S5、获得关键点定位后分别连接左侧四组水平位置对应的两个关键点;步骤S6、分别连接右侧四组水平位置对应两个关键点,重复步骤S5得到全部下肢力线。本发明实现精确特征点性能检测,提高了判断和评估速度。
-
公开(公告)号:CN115239720A
公开(公告)日:2022-10-25
申请号:CN202211155349.3
申请日:2022-09-22
Applicant: 安徽省儿童医院(安徽省新华医院、安徽省儿科医学研究所、复旦大学附属儿科医院安徽医院) , 中国科学技术大学
IPC: G06T7/00 , G06N3/04 , G06V10/44 , G06V10/54 , G06V10/764 , G06V10/774 , G06V10/82
Abstract: 本发明公开了基于经典Graf的DDH超声影像人工智能诊断系统及方法,该诊断系统包括分类器,用于从超声影像中识别标准截面;回归器,用于定位标准截面中关键点的位置信息,并利用关键点的位置计算Graf方法需要的软骨顶线夹角α、骨顶线夹角β,判断DDH的等级;所述分类器识别标准截面的方法为:对从超声影像中截取的特征图像进行特征提取与编码,编码后的特征图进行池化操作转化为特征向量,该特征向量经过全连接层后判断该特征图是否为标准截面。本发明的诊断系统能够对髋关节未成熟儿童标准髋关节超声影像片段进行筛查,且诊断更快速、客观、准确。
-
公开(公告)号:CN119723096B
公开(公告)日:2025-05-13
申请号:CN202510227653.1
申请日:2025-02-27
Applicant: 中国科学技术大学
Abstract: 本发明公开了一种开放词汇图像语义分割方法、系统、设备及存储介质,它们是一一对应的方案,相关方案与传统的方法不同,不仅能够生成准确且多样的识别结果,涵盖了属性和多层次语义信息,并且,通过视觉到语言的学习,具有更强的泛化能力,能够更灵活地处理不同的视觉内容,并能够有效识别开放场景中的目标;通过实验结果表明,本发明的方案可以在多个数据集上提升开放词汇图像语义分割性能,此外,本发明的方案也具有高可扩展性,其有潜力作为一个自动化系统,用于自动化的标注。
-
公开(公告)号:CN119888581A
公开(公告)日:2025-04-25
申请号:CN202510349413.9
申请日:2025-03-24
Applicant: 中国科学技术大学
IPC: G06V20/40 , G06V10/774
Abstract: 本发明公开了一种视频理解大模型优化与评估方法、系统、设备及存储介质,它们还是一一对应的方案,方案中:设计了新的连接器结构以提升全局时序理解能力,其包含时空下采样器,局部双向Mamba结构以及线性层组成。时空下采样器能够降低令牌存储开销;同时,局部双向Mamba结构,一方面弥补了感受野受限的问题,另一方面其能够同时建模帧内特征和帧间特征;此外,该连接器的训练是低成本的,并且使用了三阶段的渐进式训练策略,可以对抗灾难性遗忘;并且,还构建了半自动化数据生成管道并基于此管道提出了全局时序理解数据,以弥补现有基准领域在该能力上的评估空缺。
-
公开(公告)号:CN119444750A
公开(公告)日:2025-02-14
申请号:CN202510036467.X
申请日:2025-01-09
Applicant: 中国科学技术大学
IPC: G06T7/00 , G06N3/0464 , G06N3/0475 , G06N3/094 , G06V10/764
Abstract: 本发明公开了一种生成式人工智能生成图像检测方法、系统、设备及介质,它们是一一对应的方案,方案中:基于预训练图像编码器进行微调,所消耗的训练资源较少,即插即用;并且,通过插入的适配器可以自适应凸显图像特征中的生成痕迹,挖掘生成图像的局部细节伪影,灵活度高;基于本发明的方案,可以同时对基于GAN及DM的两类主要生成图像进行检测,泛化性高,实用性强,平均鉴别精度可达90%以上。
-
公开(公告)号:CN114170099B
公开(公告)日:2025-01-28
申请号:CN202111461936.0
申请日:2021-12-02
Applicant: 中国科学技术大学 , 北京京东尚科信息技术有限公司
Abstract: 本发明公开了一种任意形状场景文字擦除方法、系统、设备与存储介质,相关方法包括:构建级联若干擦除模块的网络结构,渐进式地对文字图像中文字区域进行擦除;其中,第一级擦除模块输入原始图像,后一级擦除模块输入为前一级擦除模块输出的图像以及原始图像,结合原始图像对前一级擦除模块输出的图像进行优化;通过级联的擦除模块迭代的进行文字区域擦除操作,由最后一级擦除模块最终输出文字擦除后的图像。上述方案通过迭代地擦除操作,文字的字迹能够逐步地被擦除,保证了场景文字擦除的彻底性。同时只对文字区域的像素进行修改,有效地保护了背景纹理的完整性。
-
公开(公告)号:CN118379401B
公开(公告)日:2024-08-20
申请号:CN202410824832.9
申请日:2024-06-25
Applicant: 中国科学技术大学
IPC: G06T13/20 , G06T13/40 , G06V40/16 , G06V10/26 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/047 , G06N3/0475
Abstract: 本发明公开了一种说话人视频合成方法、系统、设备及存储介质,它们是一一对应的方案,方案中:首先,将静态人物肖像图的前景与背景进行了分离,从而能够更多地关注运动范围较大的关键领域;其次,通过金字塔形结构的面部扭曲流场与掩码提高了关键点引导的面部运动的精度,并且通过将身份表征引入合成过程进一步提高了视频中的身份一致性;最后,基于扩散模型无缝地将前景区域与粗糙的背景融合到说话人视频中,实现了更好的生成效果。本发明上述方案成功地缓解了边界伪影问题并提升了说话人视频合成结果中的身份一致性。
-
公开(公告)号:CN117078942B
公开(公告)日:2024-02-23
申请号:CN202311319576.X
申请日:2023-10-12
Applicant: 中国科学技术大学
IPC: G06V10/26 , G06V10/77 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种上下文感知的指称图像分割方法、系统、设备及存储介质,它们是一一对应的方案,方案中:利用注意力机制进行所述合并多尺度特征与上下文感知的掩膜文本特征之间的交互,能够显著增强了文本特征的视觉上下文感知能力,促进跨模态的特征对齐;同时,本发明还引入多尺度视觉上下文的文本提示,在文本编码阶段进一步融合了上下文信息,并且,针对无法与文本描述有效对齐的非目标像素(即背景像素),本发明所提出的掩膜提示作为文本描述在掩膜解码阶段的扩展向量,用于代替无关的文
-
公开(公告)号:CN117056550B
公开(公告)日:2024-02-23
申请号:CN202311320335.7
申请日:2023-10-12
Applicant: 中国科学技术大学
IPC: G06F16/583 , G06N3/042 , G06V10/44 , G06V10/764 , G06V10/82
Abstract: 本发明公开了一种长尾图像检索方法、系统、设备及存储介质,它们是一一对应的方案,方案中:在尾部类别样本过少的情况下利用动态哈希代理和动态特征代理准确描述类别语义,从而有效提高尾部类别样本对应哈希码的判别性,本发明可应用于各类以图搜图场景,能够在部分数据稀缺的情况下实现准确高效的大规模图像检索,在实施上,可以安装于各类以图搜图系统的后台服务器,具有存储开销低,检索速度快,检索精度高等优点。
-
公开(公告)号:CN117037136B
公开(公告)日:2024-02-23
申请号:CN202311305720.4
申请日:2023-10-10
Applicant: 中国科学技术大学
Abstract: 本发明公开了一种场景文本识别方法、系统、设备及存储介质,它们是一一对应的方案,方案中:从文本图像天然包含文本序列的阅读顺序和序列中每一个字符的视觉语义概念特性出发,在预训练阶段中实现对视觉空间中文本序列阅读顺序的感知和建模,并进一步地增强了局部的字符视觉语义。通过大量的实验证明了本发明性能优于以往的方法,对于规则,不规则文本以及模糊遮挡等多种真实场景下的文本图像均具备鲁棒的识别效果和先进的识别精度。
-
-
-
-
-
-
-
-
-