-
公开(公告)号:CN118153684A
公开(公告)日:2024-06-07
申请号:CN202410565104.0
申请日:2024-05-09
Applicant: 中国科学技术大学
Abstract: 本发明公开了基于知识驱动的大模型情绪溯源及传播路径分析方法,涉及人工智能技术领域,将事件和用户情绪输送到溯源路径模型中,以输出事件与用户情绪之间的因果关系以及用户情绪传播的最短路径;溯源路径模型的训练过程如下:构建训练集,训练集中包括事件和用户情绪;将事件和用户情绪输送到因果关系模型中,生成事件与用户情绪之间是否存在因果关系以及因果关系的强弱;将因果关系以及因果关系的强弱输送到传播路径模型中,以预测用户情绪传播的最短路径,基于所生成的用户情绪传播的最短路径调整溯源路径模型中的模型参数;该情绪溯源及传播路径分析方法提升了事件和用户情绪的因果预测的准确性以及有效地实现对用户情绪的溯源。
-
公开(公告)号:CN118072386A
公开(公告)日:2024-05-24
申请号:CN202410115516.4
申请日:2024-01-26
Applicant: 中国科学技术大学
IPC: G06V40/20 , G06V10/44 , G06V10/80 , G06V10/762 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本公开提供了一种基于最优传输聚类的弱监督视频动作检测方法,可以应用于人工智能、动作检测、计算机视觉技术领域。该方法包括:对待检测的输入视频进行特征提取,得到目标视频特征,输入视频包括动作信息和背景信息;基于初始类心对目标视频特征进行聚类,得到目标类心,初始类心包括初始动作类心和初始背景类心;基于交叉注意力机制,确定目标类心与目标视频特征之间的注意力权重,其中,注意力权重用于表征目标类心与目标视频特征之间的相似程度;以及根据注意力权重和类别标签,确定针对输入视频的类别激活序列,其中,类别激活序列包括多个动作类别和一个背景类别;以及根据类别激活序列,确定动作信息的目标动作类别。
-
公开(公告)号:CN117313709B
公开(公告)日:2024-03-29
申请号:CN202311614320.1
申请日:2023-11-29
Applicant: 中国科学技术大学
IPC: G06F40/216 , G06N3/045 , G06N3/0455 , G06N3/096 , G06F18/213 , G06F18/2415 , G06F18/2431 , G06F18/25 , G06F18/27
Abstract: 本发明涉及生成文本检测技术领域,公开了一种基于统计信息和预训练语言模型的生成文本检测方法,通过由统计学习模型、深度学习模型和动态融合框架组成的检测模型,检测生成的文本的类别标签;检测模型的构建方法包括:构建统计学习模型;构建深度学习模型;构建动态融合框架;基于训练数据集,通过计算关于动态融合得到的类别标签概率分布和真实的类别标签的交叉熵损失函数来训练检测模型。统计学习模型有效缓解了在多领域标注数据有限的情况下模型迁移性差的问题,深度学习模型摆脱了手工设计特征的问题,可以提取更加隐式的特征,动态融合框架在损失较少检测效果的前提下提高了模型的迁移能力。
-
公开(公告)号:CN116977796B
公开(公告)日:2024-02-23
申请号:CN202311237308.3
申请日:2023-09-25
Applicant: 中国科学技术大学
IPC: G06V10/774 , G06N3/0464 , G06V10/42 , G06V10/80 , G06V10/82
Abstract: 本发明公开了一种零样本图像识别方法、系统、设备及存储介质,它们是一一对应的方案,方案中:将频域特征引入到零样本学习任务中,与现有的在RGB域中学习和训练模型的零样本识别任务相比,本发明对于局部重要特征的识别度更高,定位更加精准,同时本发明注重于学习重要的语义知识,从而进行更加细致的视觉语义信息交互,显著提高零样本任务的性能,使图像识别
-
公开(公告)号:CN117291175A
公开(公告)日:2023-12-26
申请号:CN202311584926.5
申请日:2023-11-27
Applicant: 中国科学技术大学
IPC: G06F40/216 , G06F40/284 , G06N3/045 , G06F18/2415 , G06F18/2431 , G06F18/25
Abstract: 本发明涉及自然语言理解技术领域,公开了一种基于多个大语言模型统计特征融合的生成文本检测方法,通过由统计特征融合模型和分类模型组成的检测模型,检测生成的文本的类别标签;检测模型的构建方法包括:构建基于多个大语言模型的统计特征融合模型;构建分类模型;通过计算预测类别标签和真实标签的交叉熵损失函数来训练检测模型。本发明基于多个大语言模型的统计特征融合模型有效缓解了在多种类型语言模型生成不同的文本的情况下,模型拟合能力差和缺乏鲁棒性的问题。多统计特征融合降低了检测模型的不准确性和脆弱性。
-
公开(公告)号:CN117131187A
公开(公告)日:2023-11-28
申请号:CN202311395915.2
申请日:2023-10-26
Applicant: 中国科学技术大学
IPC: G06F16/34 , G06N3/0455 , G06N3/084
Abstract: 本发明涉及对话摘要生成技术领域,公开了一种基于噪声绑定扩散模型的对话摘要方法,训练过程包括:根据输入对话生成相应的询问信息;将询问信息和对话串联拼接输入对话编码器,得到询问感知的对话表征;随机生成噪声信息,并将人工标注的对话摘要转换为二进制的比特表征,使用噪声信息对进行扩散加噪处理,得到加噪表征;使用扩散编码‑解码器对加噪表征进行去噪处理,得到去噪的比特表征,将去噪的比特表征与比特表征对比得到扩散损失,通过扩散损失并使用反向传播算法更新扩散编码‑解码器的模型参数;通过使用基于噪声绑定的扩散编码‑解码器进行不同角色的摘要生成,能够有效地从对话中辨别出充当噪声的无关信息,提升生成摘要的质量。
-
公开(公告)号:CN117095084A
公开(公告)日:2023-11-21
申请号:CN202311355828.4
申请日:2023-10-19
Applicant: 中国科学技术大学
IPC: G06T11/60 , G06N5/04 , G06N3/0464 , G06N3/0455 , G06N3/047 , G06N3/048 , G06N3/0475 , G06N3/094 , G06N3/0985 , G06V20/70 , G06V10/80 , G06V10/82
Abstract: 本发明公开了一种文本风格图像生成方法、系统、设备及存储介质,它们是一一对应的方案,方案中:无需显示的参考风格,只需文本内容与参考风格图像,即可通过视觉上下文感知和文本语义感知的方式生成文本风格图像,具有兼顾美观和效率的优点,用于海报文字的自动化设计领域时,可以将任意文本内容和谐、美观、有创意地生成在海报图像上的指定位置。
-
公开(公告)号:CN111222583B
公开(公告)日:2023-11-17
申请号:CN202010042082.1
申请日:2020-01-15
IPC: H04N1/32 , G06N3/0464 , G06N3/094
Abstract: 本发明公开了一种基于对抗训练与关键路径提取的图像隐写分析方法,包括:对于待检测图像,分别输入至经过对抗训练的隐写分析模块、以及基于关键路径提取的隐写分析模块;所述待检测图像包括:非隐写图像、传统隐写图像和对抗嵌入隐写图像,其中传统隐写图像和对抗嵌入隐写图像都属于隐写图像的类别;获得两个模块各自输出的待检测图像为隐写图像的概率,再结合两个模块的权重,采用加权融合的方式,获得最终待检测图像为隐写图像的概率。该方法可以检测经过对抗嵌入生成的隐写图像,同时在一定程度上权衡了对抗训练带来的传统隐写图像和非隐写图像准确率下降问题。
-
公开(公告)号:CN117037136A
公开(公告)日:2023-11-10
申请号:CN202311305720.4
申请日:2023-10-10
Applicant: 中国科学技术大学
Abstract: 本发明公开了一种场景文本识别方法、系统、设备及存储介质,它们是一一对应的方案,方案中:从文本图像天然包含文本序列的阅读顺序和序列中每一个字符的视觉语义概念特性出发,在预训练阶段中实现对视觉空间中文本序列阅读顺序的感知和建模,并进一步地增强了局部的字符视觉语义。通过大量的实验证明了本发明性能优于以往的方法,对于规则,不规则文本以及模糊遮挡等多种真实场景下的文本图像均具备鲁棒的识别效果和先进的识别精度。
-
公开(公告)号:CN116977796A
公开(公告)日:2023-10-31
申请号:CN202311237308.3
申请日:2023-09-25
Applicant: 中国科学技术大学
IPC: G06V10/774 , G06N3/0464 , G06V10/42 , G06V10/80 , G06V10/82
Abstract: 本发明公开了一种零样本图像识别方法、系统、设备及存储介质,它们是一一对应的方案,方案中:将频域特征引入到零样本学习任务中,与现有的在RGB域中学习和训练模型的零样本识别任务相比,本发明对于局部重要特征的识别度更高,定位更加精准,同时本发明注重于学习重要的语义知识,从而进行更加细致的视觉语义信息交互,显著提高零样本任务的性能,使图像识别能力更强,识别结果的准确度更高。
-
-
-
-
-
-
-
-
-