-
公开(公告)号:CN105741161A
公开(公告)日:2016-07-06
申请号:CN201610064443.6
申请日:2016-01-29
Applicant: 北京邮电大学
IPC: G06Q30/06
CPC classification number: G06Q30/0609
Abstract: 基于司机信用的识别打车业务中刷单用户的方法和系统,方法包括有:设定若干个信用指标,并将所有信用指标划分成多个信用指标群,且每个信用指标隶属于其中一个信用指标群;为每个信用指标群分别设定多个样本用户,提取样本用户对应信用指标群的信用指标值,然后计算每个信用指标群中的每个信用指标的权重值;根据信用指标群两两之间的重要性程度对比关系,构造重要性等级构造判别矩阵,从而计算每个信用指标群的权重值;计算每个司机在打车业务中的信用评分,并据此来识别打车业务中的刷单用户。本发明属于移动互联网技术领域,能通过计算司机的信用评分来有效识别打车业务中的刷单用户,同时降低系统误判,提高识别效率。
-
公开(公告)号:CN114360071B
公开(公告)日:2024-12-03
申请号:CN202210028558.5
申请日:2022-01-11
Applicant: 北京邮电大学
IPC: G06V40/30 , G06V10/764 , G06V10/82 , G06V10/80 , G06V10/776 , G06N3/045 , G06N3/0464 , G06N3/08 , G06N3/048
Abstract: 基于人工智能实现离线手写签名验证的方法,针对离线场景下的手写签名验证问题,使用SVM以及孪生神经网络框架进行特征提取与结果分类,同时使用逆鉴别网络思想,对输入的签名图片进行像素反转,得到多组数据同时进行验证;本发明方法不仅使用了深度学习的方法,而且同时结合了机器学习的方法,使得本发明的方法可靠性和准确率更高。
-
公开(公告)号:CN117633235A
公开(公告)日:2024-03-01
申请号:CN202311687446.1
申请日:2023-12-11
Applicant: 北京邮电大学
IPC: G06F16/35 , G06F18/25 , G06F40/30 , G06V30/182 , G10L15/187 , G06N3/0464 , G06N3/0455 , G06N3/09 , G06N3/094 , G06N3/092
Abstract: 基于大模型和动态知识检索的恶意文本内容审核系统和方法,系统包括如下模块:语言模型模块、表征模型模块、动态知识库模块、多模态表征模块和内容分类模块;方法包括如下操作步骤:(1)将待分类文本输入到多模态表征模块;(2)多模态表征模块将待分类文本进行多模态表征处理,分别得到待分类文本的语义表征、字形表征和读音表征,然后将上述表征进行加权融合,得到所述待分类文本的融合特征;(3)将所述待分类文本的融合特征输入到所述语言模型模块中的轻量级文本分类语言模型中,得到待分类文本的类别。
-
公开(公告)号:CN112115995B
公开(公告)日:2023-04-07
申请号:CN202010954339.0
申请日:2020-09-11
Applicant: 北京邮电大学
IPC: G06V10/774 , G06V10/764 , G06V10/82
Abstract: 一种基于半监督学习的图像多标签分类方法,包括:从训练数据集中分别提取有标签数据和无标签数据的训练图片,并构成有标签数据集、无标签数据集,然后为每张训练图片标注标签向量;构建图像多标签分类网络,将有标签数据集和无标签数据集中的所有训练图片作为训练样本输入进行半监督训练,其输入是有标签数据集和无标签数据集的训练图片及标签向量,输出是训练图片对应各标签的预测概率;为待分类图片标注标签向量,然后将待分类图片及标签向量输入图像多标签分类网络,并根据输出确定待分类图片的多个标签。本发明属于信息技术领域,能基于无标签和有标签数据组成的混合数据集实现图像多标签分类,充分利用标签有效信息,有效提高网络分类性能。
-
公开(公告)号:CN112115995A
公开(公告)日:2020-12-22
申请号:CN202010954339.0
申请日:2020-09-11
Applicant: 北京邮电大学
IPC: G06K9/62
Abstract: 一种基于半监督学习的图像多标签分类方法,包括:从训练数据集中分别提取有标签数据和无标签数据的训练图片,并构成有标签数据集、无标签数据集,然后为每张训练图片标注标签向量;构建图像多标签分类网络,将有标签数据集和无标签数据集中的所有训练图片作为训练样本输入进行半监督训练,其输入是有标签数据集和无标签数据集的训练图片及标签向量,输出是训练图片对应各标签的预测概率;为待分类图片标注标签向量,然后将待分类图片及标签向量输入图像多标签分类网络,并根据输出确定待分类图片的多个标签。本发明属于信息技术领域,能基于无标签和有标签数据组成的混合数据集实现图像多标签分类,充分利用标签有效信息,有效提高网络分类性能。
-
公开(公告)号:CN109711309B
公开(公告)日:2020-11-27
申请号:CN201811561523.8
申请日:2018-12-20
Applicant: 北京邮电大学
IPC: G06K9/00
Abstract: 一种自动识别人像图片是否闭眼的方法,包括:采集人像图片;检测获取人像图片中左、右眼周围特征点的坐标;从人像图片中截取左、右眼图片;训练左、右眼‑卷积神经网络,左或右眼‑卷积神经网络的输入是左或右眼图片,输出是左或右眼是否闭眼的概率;将从待识别人像图片中截取出的左、右眼图片分别输入训练后的左、右眼‑卷积神经网络,然后从左、右眼‑卷积神经网络中分别提取中间层的输出作为左、右眼特征向量,并构成眼部整体特征向量;对眼部整体特征向量进行线性变换,并采用归一化指数函数计算左闭眼、右闭眼、双眼闭眼和睁眼的概率,以据此判断左、右眼是否闭眼。本发明属于信息技术领域,能精确识别人像图片中的左、右眼是否闭眼。
-
公开(公告)号:CN111611431A
公开(公告)日:2020-09-01
申请号:CN202010301644.X
申请日:2020-04-16
Applicant: 北京邮电大学
Abstract: 一种基于深度学习的音乐分类方法,包括:将音乐的音频文件转化成梅尔声谱图,并生成音乐标签的独热向量;将音乐的梅尔声谱图和音乐标签的独热向量分别传入卷积神经网络和循环神经网络,通过卷积神经网络获得音乐的频域和时域特征向量,通过循环神经网络获得音乐-标签关系向量,然后将卷积神经网络和循环神经网络各自的输出向量映射到相同维度后,连接合并构成一个音乐-标签嵌入向量;将音乐-标签嵌入向量传入标签预测层,其输出是音乐对应每个类别标签的概率值,最后根据概率值,从所有类别标签中挑选多个类别标签作为音乐的分类。本发明属于信息技术领域,能基于音乐类别的繁多和交错关系,实现音乐类别标签的准确预测。
-
公开(公告)号:CN119229456A
公开(公告)日:2024-12-31
申请号:CN202411267641.3
申请日:2024-09-11
Applicant: 北京邮电大学
IPC: G06V30/19 , G06V30/148 , G06V30/146 , G06V30/18 , G06V10/82 , G06N3/045
Abstract: 一种基于多模态大模型的视觉信息提取方法,包括如下步骤:(1)使用三类专门数据,即文本定位数据、视觉参考数据和链式思考数据对多模态大模型进行微调;(2)用户上传目标图片并输入文字提示,根据情况触发模板库检索并添加上下文信息;(3)多模态大模型产生初步回复结果并结合OCR文字识别结果生成最终回复结果;(4)对话历史和元信息将被整合并保存到模板库中;本发明方法实现了结果文本框的准确输出,配合专用OCR模型完成了对大模型输出结果的纠错,提高了视觉信息提取的准确率和可信度。
-
公开(公告)号:CN118779429A
公开(公告)日:2024-10-15
申请号:CN202410945806.1
申请日:2024-07-15
Applicant: 北京邮电大学
IPC: G06F16/332 , G06F40/126 , G06F40/194 , G06F40/279
Abstract: 基于检索增强生成的知识库存储检索系统和方法,主要内容是:(1)文档提取与分块模块,把加入知识库的文档切分为文档块,形成文档列表和关键字列表;(2)文档向量化与存储模块,把向量化后的文档列表和关键字列表存贮到向量库中;(3)文档窗口设置模块,根据用户的提问信息,确定文档窗口值W的大小;(4)初步检索模块,提取出文档相似度值最大的前W个文档,作为初步检索结果;(5)混合重排序模块根据综合相似度s值的大小,从初步检索结果中返回W/2个文档作为最终检索结果。本发明对多模态问答大模型具有支持能力。
-
公开(公告)号:CN114139533A
公开(公告)日:2022-03-04
申请号:CN202111480639.0
申请日:2021-12-06
Applicant: 北京邮电大学
IPC: G06F40/279 , G06F40/216 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 一种面向中文小说领域的文本内容审核方法,包括:获取敏感词及所属类别,构建敏感词库;通过字符串匹配算法,检测待审核文本是否包含敏感词,如果是,则待审核文本是违规文本,且分类是敏感词所属类别,如果否,则继续下一步;设置多个违规分类标签,构建并训练小说文本内容审核模型,然后将待审核文本输入模型中,其工作流程如下:计算输入文本的语义特征向量和每个违规分类标签的信息特征向量,再计算输入文本和每个违规分类标签的相关语义特征向量,最后采用胶囊网络对相关语义特征向量聚类,根据顶层胶囊的每个违规分类标签的类别概率确定输入文本的分类。本发明属于信息技术领域,能实现中文小说文本内容自动审核,并提高审核准确率及效率。
-
-
-
-
-
-
-
-
-